Preguntas con respuestas sobre "random-forest"

34 preguntas, página #1

6

votos

1

respuestas

vistas 1,923

RandomForest en colas de regresión lineal R mtry

Estoy usando el paquete randomForest en R (R versión 2.13.1, randomForest versión 4.6-2) para la regresión y noté un sesgo significativo en mis resultados: el error de predicción depende del valor de la variable de respuesta. Los valores altos están por debajo de lo previsto y los valores bajos están por encima de lo previsto. Al principio yo...

preguntado 10 años, 10 meses

7

votos

1

respuestas

vistas 18,112

Bosque aleatorio en un gran conjunto de datos

Tengo un gran conjunto de datos en R (más de 1 millón de filas por 6 columnas) que quiero usar para entrenar un bosque aleatorio (usando el paquete randomForest) con fines de regresión. Desafortunadamente, recibo un error en la matriz (0, n, n): demasiados elementos especificaron un error al intentar hacer todo a la vez y no puedo asignar ...

preguntado 10 años, 11 meses

1

votos

1

respuestas

vistas 239

Aumento de la eficiencia de Python al copiar grandes conjuntos de datos

Tengo algunos problemas con una implementación de bosques aleatorios en los que estoy trabajando en Python. Sin tener en cuenta, soy muy consciente de que Python no está diseñado para procesar números de manera altamente eficiente. La elección se basó más en querer obtener una comprensión más profunda y experiencia adicional en Python. ...

preguntado 11 años, 0 meses

0

votos

1

respuestas

vistas 158

¿Cómo estimar la cantidad de memoria necesaria para el clasificador binario?

Digamos que quiero crear un clasificador binario para detectar mensajes de SPAM. Tengo mil millones de ejemplos de entrenamiento y alrededor de 20 funciones. Quiero que mi clasificador entrenado quepa en la memoria (lo ejecutaré en la nube y las operaciones de disco que en realidad son llamadas rpc serán muy caras). ...

preguntado 11 años, 1 meses

23

votos

4

respuestas

vistas 19,894

Sugerencias para acelerar los bosques aleatorios

Estoy trabajando con el paquete randomForest y, aunque funciona bien, puede llevar mucho tiempo. ¿Alguien tiene alguna sugerencia para acelerar las cosas? Estoy usando una caja de Windows 7 con un chip AMD de doble núcleo. Sé que R no es multiproceso / procesador, pero tenía curiosidad por saber si alguno de los paralelos ...

preguntado 11 años, 5 meses

8

votos

4

respuestas

vistas 6,256

R pone varios objetos randomForest en un vector

Tengo curiosidad por saber si R tiene la capacidad de colocar objetos en vectores / listas / matrices / etc. Estoy usando el paquete randomforest para trabajar en subconjuntos de un dato más grande y me gustaría almacenar cada versión en una lista. Sería similar a esto: ...

preguntado 11 años, 5 meses