Interpretable Neural Networks by Decoupling Linear and Non-linear Effects
En este trabajo presentamos una arquitectura neuronal para problemas que requieren simultáneamente precisión predictiva e interpretabilidad. Aunque combinar modelos lineales con redes neuronales puede equilibrar ambos objetivos, las arquitecturas híbridas estándar sufren signal stealing, por el que la componente flexible absorbe variación linealmente explicable y dificulta la interpretación de los coeficientes lineales. Proponemos un predictor con una rama lineal explícita y una rama neuronal general, e introducimos un mecanismo de ortogonalización por mini lotes que proyecta la salida no lineal sobre el complemento ortogonal del espacio lineal. Los resultados en simulación y en varios conjuntos de datos reales muestran que este procedimiento mitiga el signal stealing, mejora la recuperación de los efectos lineales y mantiene un rendimiento predictivo competitivo frente a una red neuronal, a una regresión lineal y a una regresión lineal más red neuronal sobre residuos.
Palabras clave: Deep Learning Interpretability Orthogonalisation Regression Models Signal Stealing