Preguntas con respuestas sobre "data-mining"

615 preguntas, página #1

8

votos

3

respuestas

vistas 19,009

Fórmula para "Error absoluto relativo" y "Error cuadrático relativo de la raíz" utilizada en el aprendizaje automático (según lo calculado por Weka)

En el software de minería de datos de código abierto Weka (escrito en Java), cuando ejecuto algún algoritmo de minería de datos como la regresión lineal, Weka devuelve el modelo y algún modelo que evalúa las métricas para los datos de prueba. ...

preguntado 10 años, 8 meses

0

votos

1

respuestas

vistas 1,479

¿La clasificación en weka falla, causada por la distinción entre mayúsculas y minúsculas de los valores nominales?

Hice un clasificador para clasificar las consultas de búsqueda en una de las siguientes clases: {Artista, Actor, Político, Atleta, Instalación, Geo, Definición, Control de calidad}. Tengo dos archivos csv: uno para entrenar el clasificador (contiene 300 consultas) y otro para probar el clasificador (actualmente contiene alrededor de 200...

preguntado 10 años, 8 meses

2

votos

1

respuestas

vistas 2,487

Biblioteca Java de Weka: ¿cómo obtener una representación de cadena de una instancia clasificada?

Actualmente estoy trabajando en un proyecto para clasificar las consultas de búsqueda en los siguientes ocho tipos: {atleta, actor, artista, político, ubicación geográfica, instalación, control de calidad, definición}. Después de un poco de trabajo, logré obtener un 78 % de instancias clasificadas correctamente para mi conjunto de 300 consultas de muestra usando una multicapa...

preguntado 10 años, 8 meses

2

votos

1

respuestas

vistas 111

Alcanzar un equilibrio adecuado entre rendimiento y escalabilidad en una base de datos grande

Estoy tratando de determinar cuál de los muchos modelos de base de datos admitiría mejor la comparación de registros probabilísticos. Específicamente, tengo aproximadamente 20 millones de documentos definidos por una variedad de atributos (nombre, tipo, autor, propietario, etc.). Los atributos de texto dominan el conjunto de datos, pero todavía hay...

preguntado 10 años, 8 meses

2

votos

3

respuestas

vistas 905

Comparación de resultados de agrupamiento en Carrot2

Estoy usando la herramienta Carrot2 para mi tesis y ejecuto diferentes algoritmos en esta herramienta. Mi pregunta es, ¿cómo puedo comparar científicamente los resultados de diferentes algoritmos? Quiero decir, necesito una prueba de que los resultados de agrupamiento del algoritmo 1 son mejores que los resultados del algoritmo 2. Haz entropía y...

preguntado 10 años, 8 meses

5

votos

1

respuestas

vistas 1,666

R: Uso de la biblioteca bigmemory para la clasificación con randomForest

¿Alguien ha podido configurar una clasificación (no una regresión) usando randomForest Y la biblioteca bigmemory? Soy consciente de que el "enfoque de fórmula" no se puede usar y tenemos que recurrir al "enfoque x = predictores, y = respuesta". Parece que la gran biblioteca de memoria no puede lidiar con un ...

preguntado 10 años, 9 meses

-2

votos

3

respuestas

vistas 4,350

¿Minería de texto en documentos de MS Word?

Tengo alrededor de 30 documentos .docx (currículums) con datos sobre nombres de personas, habilidades, etc. Necesito completar una hoja de cálculo con parte de esta información y, para reducir el trabajo manual, pensé que podría usar un enfoque de minería de texto. ...

preguntado 10 años, 9 meses