QSPR study of the water solubility of a diverse set of agrochemicals: hybrid (GA/ MLR) approach

  • Amel Bouakkadia
  • Hamza Haddag
  • Nabil Bouarra
  • Djelloul Messadi
Keywords: pesticides- aqueous solubility- QSPR- molecular descriptors- multiple linear regression.

Abstract

A quantitative structure- property relationship (QSPR) was performed for the  prediction of the aqueous solubility of pesticides belonging to four chemical classes: acid, urea, triazine, and carbamate. The entire set of 77 pesticides was  divided into a training set of 58 pesticides and a test set of 19 pesticides according to the Snee technique. A six descriptor model, with squared correlation coefficient  (R2) of 0.8895 and standard error of estimation (s) of 0.52 log unit, was developed  by applying multiple linear regression analysis using the ordinary least square  regression method and genetic algorithm- variable subset selection. The reliability of the proposed model was further illustrated using various evaluation techniques:  leave- one- out cross- validation, bootstrap, randomization tests, and validation through the test set.

Key Words: pesticides- aqueous solubility- QSPR- molecular descriptors- multiple  linear regression.

 

Etude QSPR de la solubilité aqueuse d'un ensemble de divers produits
agrochimiques: approche hybride (AG/RLM)


Une relation quantitative structure-propriété (QSPR) a été réalisée pour la prédiction de la solubilité aqueuse des
pesticides appartenant aux quatre classes chimiques: acide, urée, triazine, et carbamate. L'ensemble des 77
pesticides a été divisé en un ensemble de calibrage de 58 pesticides et un ensemble de test de 19 pesticides selon
la technique de Snee. Un modèle de six descripteurs, avec un coefficient de corrélation (R2) de 0,8895 et une
erreur standard d'estimation (s) de 0,52, a été développé en appliquant une analyse de régression linéaire multiple
en utilisant la méthode de régression des moindres carrés ordinaires et les algorithme-génétiques pour la
sélection des sous-ensembles de variables. La fiabilité du modèle proposé a été en outre illustrée en utilisant
diverses techniques d'évaluation: validation croisée par leave- one- out, bootstrap, tests de randomisation, et la
validation par l'ensemble de test.

Mots clés: pesticides- solubilité aqueuse- QSPR- descripteurs moléculaires- régression linéaire multiple.

Published
2016-05-18
Section
Articles

Journal Identifiers


eISSN: 2352-9717
print ISSN: 1111-4924