Cuanto cuesta un predictor
ejemplos de estadísticas de predicción
Ha realizado una regresión lineal múltiple y se ha decantado por un modelo que contiene varias variables predictoras que son estadísticamente significativas. En este punto, es común preguntarse: «¿Qué variable es la más importante?».
Esta pregunta es más complicada de lo que parece a primera vista. Por un lado, la definición de «más importante» suele depender de su área temática y sus objetivos. Por otro, la forma de recoger y medir los datos de la muestra puede influir en la importancia aparente de cada variable.
Teniendo en cuenta estas cuestiones, le ayudaré a responder a esta pregunta. Empezaré por mostrarte estadísticas que no responden a la pregunta sobre la importancia, lo que puede sorprenderte. A continuación, pasaré a los métodos estadísticos y no estadísticos para determinar qué variables son las más importantes en los modelos de regresión.
Los coeficientes de regresión regulares describen la relación entre cada variable de predicción y la respuesta. El valor del coeficiente representa el cambio medio en la respuesta dado un aumento de una unidad en el predictor. En consecuencia, es fácil pensar que las variables con coeficientes más grandes son más importantes porque representan un cambio mayor en la respuesta.
predicción del precio del producto
Bien, ya hemos aprendido todo lo bueno que puede ocurrir cuando los predictores están perfectamente o casi perfectamente descorrelacionados. Ahora, vamos a descubrir las cosas malas que pueden ocurrir cuando los predictores están altamente correlacionados.
Parece que no sólo hay una fuerte relación entre y = PA y \(x_2\) = Peso (r = 0,950) y una fuerte relación entre y = PA y el predictor \(x_3\) = BSA (r = 0,866), sino también una fuerte relación entre los dos predictores \(x_2\) = Peso y \(x_3\) = BSA (r = 0,875). Por cierto, no debería sorprender demasiado que el peso y la superficie corporal de una persona estén altamente correlacionados.
¿Qué impacto tiene la fuerte correlación entre los dos predictores en el análisis de regresión y en las posteriores conclusiones que podemos sacar? Vamos a proceder como antes, revisando el resultado de una serie de análisis de regresión y recogiendo diversos datos a lo largo del proceso. Cuando hayamos terminado, revisaremos lo que hemos aprendido cotejando los distintos elementos en una tabla resumen.
qué es la predicción de precios
Al construir un modelo de regresión, no queremos incluir predictores sin importancia o irrelevantes cuya presencia puede complicar en exceso el modelo y aumentar nuestra incertidumbre sobre las magnitudes de los efectos de los predictores importantes (especialmente si algunos de esos predictores son muy colineales). Este tipo de «sobreajuste» puede producirse cuanto más complicado sea un modelo y cuantas más variables predictoras, transformaciones e interacciones se añadan a un modelo. Siempre es prudente aplicar una comprobación de cordura a cualquier modelo que se utilice para tomar decisiones. Los modelos siempre deben tener sentido, preferiblemente basados en algún tipo de teoría de fondo o expectativa sensata sobre los tipos de asociación permitidos entre las variables. Las predicciones del modelo también deben ser razonables (los modelos demasiado complicados pueden dar resultados extravagantes que no reflejen la realidad).
Sin embargo, el riesgo de excluir predictores importantes es potencialmente mayor que el de incluir predictores sin importancia. La asociación lineal entre dos variables ignorando otras variables relevantes puede diferir tanto en magnitud como en dirección de la asociación que controla otras variables relevantes. Mientras que el coste potencial de incluir predictores sin importancia puede ser una mayor dificultad de interpretación y una menor precisión de la predicción, el coste potencial de excluir predictores importantes puede ser un modelo completamente sin sentido que contenga asociaciones engañosas. Los resultados pueden variar considerablemente según se excluyan (inadecuadamente) o se incluyan (adecuadamente) dichos predictores. Estos predictores se denominan a veces variables de confusión o al acecho, y su ausencia en un modelo puede dar lugar a decisiones incorrectas y a una toma de decisiones deficiente.
regresión y predicción en estadística
ResumenEl coste de impacto del mercado es la parte más significativa de los costes de transacción implícitos que puede reducir el coste total de la transacción, aunque no puede medirse directamente. En este trabajo, empleamos los modelos de aprendizaje automático no paramétricos más avanzados: redes neuronales, red neuronal bayesiana, proceso gaussiano y regresión de vectores de apoyo, para predecir el coste de impacto del mercado con precisión y proporcionar el modelo predictivo que es versátil en el número de variables. Recogimos una gran cantidad de datos reales de transacciones individuales del mercado de valores de EE.UU. de la terminal Bloomberg y generamos tres variables de entrada independientes. Como resultado, la mayoría de los modelos de aprendizaje automático no paramétricos superaron a un modelo paramétrico de referencia de última generación, como el modelo I-star, en cuatro medidas de error. Aunque estos modelos encuentran ciertas dificultades a la hora de separar directamente los costes permanentes y temporales, los modelos de aprendizaje automático no paramétricos pueden ser una buena alternativa para reducir los costes de transacción mejorando considerablemente el rendimiento de la predicción.
Relacionados
Bienvenid@ a mi blog, soy Octavio Pérez Alonso y te ofrezco noticias de actualidad.
Comments are closed