Preguntas con respuestas sobre "cosine-similarity"

11 preguntas, página #1

0

votos

1

respuestas

vistas 361

Aprendizaje automático, ¿qué enfoque usar cuando el conjunto de datos contiene solo instancias de una clase?

Tengo un conjunto de datos de un dominio particular (digamos deportes - 1 clase). Lo que quiero hacer es cuando alimenté una página web al clasificador/agrupador. Quiero obtener un resultado si esa instancia (página web) está relacionada con deportes o no. ...

preguntado 10 años, 10 meses

0

votos

1

respuestas

vistas 733

Cálculo rápido de la distancia direccional del coseno por pares entre puntos en una matriz (nxdxt)

Conozco el pdist (X, distancia) en Matlab para tomar una matriz de puntos (nxd) y calcular las distancias por pares entre ellos. También soy consciente de que tiene una opción adicional para calcular la distancia del coseno si una matriz contiene vectores en lugar de puntos. ...

preguntado 10 años, 10 meses

2

votos

1

respuestas

vistas 5,299

Cómo calcular la similitud del coseno con tf-idf usando Lucene y Java

Tengo una consulta y un conjunto de documentos. Necesito clasificar estos documentos según la similitud del coseno con tf-idf. ¿Puede alguien decirme qué apoyo puedo obtener de Lucene para calcular esto? ¿Qué parámetros puedo calcular directamente desde Lucene (puedo obtener tf, idf directamente a través de algún método en...

preguntado 10 años, 11 meses

2

votos

1

respuestas

vistas 453

¿Un tf más grande siempre mejora la puntuación de los documentos en Lucene?

Entiendo que la frecuencia del término predeterminado (tf) se calcula simplemente como la raíz cuadrada de la cantidad de veces que un término en particular que se busca aparece en un campo. Por lo tanto, los documentos que contienen múltiples apariciones de un término que está buscando tendrán un tf más alto y, por lo tanto, un peso mayor. ...

preguntado 11 años, 0 meses

4

votos

1

respuestas

vistas 1,190

Devuelve el documento más similar en comparación con un documento de consulta utilizando la similitud de coseno en Python

Tengo un conjunto de archivos y un documento de consulta. Mi propósito es devolver los documentos más similares comparándolos con el documento de consulta para cada uno de los documentos. Para usar la similitud de coseno, primero tengo que asignar las cadenas del documento a los vectores. También ya lo he hecho. creó una función tf-idf que calcula para cada uno de los ...

preguntado 11 años, 0 meses

5

votos

2

respuestas

vistas 3,688

Algoritmos de concordancia basados ​​en la intersección de palabras clave

Suponga que tenemos compradores y vendedores que intentan encontrarse en un mercado. Los compradores pueden etiquetar sus necesidades con palabras clave; los vendedores pueden hacer lo mismo con lo que venden. Estoy interesado en encontrar algoritmos que clasifiquen a los vendedores en términos de su relevancia para un comprador en particular en el ...

preguntado 12 años, 0 meses