PROGRAMA COMPUTACIONAL PARA CONSTRUÇÃO E ANÁLISE DE MODELOS DE QSAR

Daniel Barbosa de Oliveira (PG) e Anderson Coser Gaudio (PQ)

Departamento de Física - Centro de Ciências Exatas – Universidade Federal do Espírito Santo


palavras-chave: programa de computador, regressão linear múltipla, qsar


Introdução. A metodologia empregada no estudo de QSAR1,2 (sigla em inglês para Relações Quantitativas entre Estrutura e Atividade) requer o uso de programas de computador específicos capazes executar diversas tarefas, como o armazenamento de grande variedade de constantes de substituintes (banco de dados), a possibilidade de fazer pesquisa no banco de dados e extrair deste um ou mais subgrupos de constantes de substituintes, organizando-os em conjuntos de dados e, a partir daí, promover seleção de variáveis e gerar análise estatística completa capaz de evidenciar as relações estrutura-atividade procuradas. Considerando-se esses aspectos, construiu-se o programa denominado QSAR que, espera-se, venha a atender às expectativas do pesquisador desta área.

As vantagens em dispor-se de um programa como QSAR são inúmeras: (a) tendo os autores experiência pessoal na prática de QSAR, há boas chances do programa realmente atender às necessidades do praticante de QSAR; (b) a propriedade do código-fonte permite grande flexibilidade para incluir possíveis modificações sugeridas pelos usuários; (c) o fato de o programa ser colocado gratuitamente à disposição da comunidade científica poderá evitar futuros gastos com a compra de programas similares e disponibilizar recursos para outros fins; (d) a utilização deste programa no ambiente Windows permite a troca de informações com outros aplicativos, como editores de texto e planilhas eletrônicas, agilizando o trabalho de publicação da pesquisa gerada.

Objetivo. O objetivo do presente trabalho é construir um programa de computador capaz de promover seleção de variáveis, construção de modelos lineares, parabólicos e bilineares, executar testes de validação interna e cruzada nos modelos, executar análise gráfica e gerenciar banco de dados de constantes de substituintes.

Metodologia. QSAR foi baseado em projeto orientado a objeto, altamente estruturado, e codificado em linguagem DELPHI, que permite integração ao ambiente Windows, estabilidade, fácil manutenção e ampliação. Baseado em interface MDI (sigla em inglês para Interface de Múltiplos Documentos), permite que diversos conjuntos de dados e bancos de dados sejam manipulados simultaneamente. Dados podem ser facilmente transferidos de um conjunto de dados para outro e também a partir do banco de dados. Várias operações são possíveis a partir de um conjunto de dados, tais como: cálculo da matriz de correlação, análise de variância, análise de regressão linear múltipla, construção de modelos parabólicos e bilineares, seleção de variáveis através de busca sistemática e análise gráfica dos resultados. Sendo esta a estrutura básica do programa, sua arquitetura permitirá que futuramente sejam incorporados métodos multivariados, como PLS (Mínimos Quadrados Parciais) e PCA (Análise de Componentes Principais), seleção de variáveis através de algoritmo genético, além de outras.

Resultados. O Diagrama 1 mostra a estrutura geral do programa QSAR, enquanto que os Diagramas 2-4 mostram as partes que compõem o Diagrama 1.

Os testes preliminares demonstraram que o programa QSAR poderá realmente ser de grande utilidade para o pesquisador da área de QSAR. Algumas facilidades incluídas no programa são: (a) facilidade para criar subconjuntos de dados, a partir do conjunto de dados principal; (b) facilidade para criar novas variáveis a partir das variáveis existentes; (c) facilidade de criação de variáveis indicadoras; (d) facilidade para eliminar os chamados outliers de modelos mal ajustados. Outras facilidades como copiar e colar, exportar gráficos em formato de figura auxiliarão a rápida publicação da pesquisa produzida.

Todos os cálculos produzidos pelo programa QSAR foram checados com programas tradicionais de estatística e a concordância, até o momento, foi perfeita.

Conclusões..A codificação do programa encontra-se em fase final e uma versão teste estará disponível para a comunidade acadêmica brasileira, à epoca deste congresso, no endereço http://www.cce.ufes.br/~anderson.

Bibliografia.. 1. Kubinyi, H.; QSAR: Hansch Analysis and Related Approaches, In: Methods and Principles in Medicinal Chemistry; R. Mannhold, P. Krogsgaard-Larsen and H. Timmerman Ed.; VCH; Weinheim, 1993. 2. Gaudio, A. C.; Química Nova 1996, 19, 278.

(PRPPG-UFES e CNPq)