Regresión logística: Una cartilla II. La Función de Coste
Desde nuestro anterior post, profundizamos en las razones que nos llevan a utilizar una función sigmoidea para la Regresión Logística en lugar de una función lineal normal. En este post, seguiremos compartiendo sobre la Función de Coste.
La Función de Coste es importante porque nos da los errores de nuestras predicciones y posteriormente, es necesaria para nuestro algoritmo de aprendizaje. Concretamente, nos gusta minimizar los errores de nuestras predicciones, es decir, minimizar la función de coste. Idealmente, si todos nuestros errores son cero, es como jugar a un juego de dardos en el que todos nuestros dardos darían en la diana. En el otro lado del argumento, si nuestros errores son muy altos, esto significa que nuestros valores predichos están perdiendo todos los verdaderos valores observados, es decir, nuestros dardos están, en general, perdiendo la diana.
Aunque nos gusta tener errores cero al ejecutar nuestra función de coste con nuestros valores hipotetizados (predicción perfecta para cada valor), esto podría no ser un buen escenario dado que podría conducir a un fenómeno llamado «alta varianza». Tocaremos más este tema en escritos posteriores.
Volviendo a la formulación de la función de pérdida, una función de pérdida típica sería minimizar la suma de errores al cuadrado, es decir
Esta función, sin embargo, puede dar lugar a múltiples óptimos locales durante el proceso de optimización, lo que significa que su solución optimizada podría no ser la más optimizada (existe la posibilidad de que haya una solución mejor). Lo ideal es que la solución optimizada sea el mínimo global, y no el mínimo local.
Como se ve en el diagrama anterior, podríamos inicializar inadvertidamente los parámetros y optimizarlos hasta el mínimo local sin alcanzar el «verdadero» mínimo global. Por lo tanto, la mencionada función de pérdida no sería la ideal para nosotros.
¿Cuál podría ser entonces nuestra función de pérdida?
Una función de pérdida comúnmente utilizada para la regresión logística es esta: