Logo
Unionpedia
Comunicación
Disponible en Google Play
¡Nuevo! ¡Descarga Unionpedia en tu dispositivo Android™!
Gratis
¡Más rápido que el navegador!
 

Tf-idf

Índice Tf-idf

Tf-idf (del inglés Term frequency – Inverse document frequency), frecuencia de término – frecuencia inversa de documento (o sea, la frecuencia de ocurrencia del término en la colección de documentos), es una medida numérica que expresa cuán relevante es una palabra para un documento en una colección.

18 relaciones: Búsqueda y recuperación de información, Cardinalidad, Consulta, Divergencia de Kullback-Leibler, División (matemática), Documento, Frecuencia, Información mutua, Latent Dirichlet Allocation, Logaritmo, McGraw Hill Education, Modelo de espacio vectorial, Motor de búsqueda, Okapi BM25, PageRank, Relevancia, Sintagma nominal, Tipo de dato lógico.

Búsqueda y recuperación de información

La búsqueda y recuperación de información es la ciencia de la búsqueda de información en documentos electrónicos y cualquier tipo de colección documental digital, encargada de la búsqueda dentro de estos mismos, búsqueda de metadatos que describan documentos, o también la búsqueda en bases de datos relacionales, ya sea a través de internet, una intranet, y como objetivo realiza la recuperación en textos, imágenes, sonido o datos de otras características, de manera pertinente y relevante.

¡Nuevo!!: Tf-idf y Búsqueda y recuperación de información · Ver más »

Cardinalidad

En matemáticas, la cardinalidad de un conjunto es la medida del "número de elementos en el conjunto".

¡Nuevo!!: Tf-idf y Cardinalidad · Ver más »

Consulta

Una consulta es el acto de tratar un asunto con una o varias personas.

¡Nuevo!!: Tf-idf y Consulta · Ver más »

Divergencia de Kullback-Leibler

En teoría de la probabilidad y teoría de la información, la divergencia de Kullback-Leibler (KL) (también conocida como divergencia de la información, ganancia de la información, entropía relativa o KLIC por sus siglas en inglés) es una medida no simétrica de la similitud o diferencia entre dos funciones de distribución de probabilidad P y Q. KL mide el número esperado de extra bits requeridos en muestras de código de P cuando se usa un código basado en Q, en lugar de un código basado en P. Generalmente P representa la "verdadera" distribución de los datos, observaciones, o cualquier distribución teórica.

¡Nuevo!!: Tf-idf y Divergencia de Kullback-Leibler · Ver más »

División (matemática)

En la matemática, la división es una operación parcialmente definida en el conjunto de los números enteros; en cambio, en el caso de los números racionales, reales y complejos es siempre posible efectuar la división, exigiendo que el divisor sea distinto de cero, sea cual fuera la naturaleza de los números por dividir.

¡Nuevo!!: Tf-idf y División (matemática) · Ver más »

Documento

Un documento es un testimonio material de un hecho o acto realizado en funciones por instituciones o personas físicas, jurídicas, públicas o privadas, registrado en una unidad de información en cualquier tipo de soporte (papel, cintas, discos magnéticos, fotografías, etc.) en lengua natural o convencional.

¡Nuevo!!: Tf-idf y Documento · Ver más »

Frecuencia

La frecuencia —denotada comúnmente con la letra griega ν o con la letra latina f— es el número de repeticiones por unidad de tiempo de cualquier proceso periódico.

¡Nuevo!!: Tf-idf y Frecuencia · Ver más »

Información mutua

En teoría de la probabilidad, y en teoría de la información, la información mutua o transinformación o ganancia de información de dos variables aleatorias es una cantidad que mide la dependencia estadística entre ambas variables.

¡Nuevo!!: Tf-idf e Información mutua · Ver más »

Latent Dirichlet Allocation

En aprendizaje automático, la Asignación Latente de Dirichlet (ALD) o Latent Dirichlet Allocation (LDA) es un modelo generativo que permite que conjuntos de observaciones puedan ser explicados por grupos no observados que explican por qué algunas partes de los datos son similares.

¡Nuevo!!: Tf-idf y Latent Dirichlet Allocation · Ver más »

Logaritmo

Sin descripción.

¡Nuevo!!: Tf-idf y Logaritmo · Ver más »

McGraw Hill Education

McGraw-Hill es una editorial estadounidense, con sede en Nueva York, fundada por James H. McGraw y John A. Hill en 1909.

¡Nuevo!!: Tf-idf y McGraw Hill Education · Ver más »

Modelo de espacio vectorial

Se conoce como modelo de espacio vectorial a un modelo algebraico utilizado para filtrado, recuperación, indexado y cálculo de relevancia de información.

¡Nuevo!!: Tf-idf y Modelo de espacio vectorial · Ver más »

Motor de búsqueda

Un motor de búsqueda o buscador es un sistema informático que busca archivos almacenados en servidores web gracias a su araña web.

¡Nuevo!!: Tf-idf y Motor de búsqueda · Ver más »

Okapi BM25

Okapi BM25 es una función de ranking utilizada en Recuperación de información para la asignación de relevancia a los documentos en un buscador, dicho de otra forma, es una función que nos permite ordenar por relevancia los documentos que contienen las palabras que el usuario ha introducido en la caja de búsqueda de un buscador como Google, Yahoo! o Live.

¡Nuevo!!: Tf-idf y Okapi BM25 · Ver más »

PageRank

PageRank es una familia de algoritmos creada y desarrollada por la compañía tecnológica estadounidense Google para optimizar las búsquedas de páginas web.

¡Nuevo!!: Tf-idf y PageRank · Ver más »

Relevancia

Los términos relevancia y relevante pueden referirse, en esta enciclopedia.

¡Nuevo!!: Tf-idf y Relevancia · Ver más »

Sintagma nominal

En sintaxis, sintagma nominal es el sintagma o grupo de palabras que forma un constituyente sintáctico maximal, cuyo núcleo está constituido por un nombre (sustantivo, pronombre o palabra sustantiva) o pronombre (si no se considera el sintagma determinante).

¡Nuevo!!: Tf-idf y Sintagma nominal · Ver más »

Tipo de dato lógico

El tipo de dato lógico, también conocido como «booleano» en honor a George Boole, es en computación aquel que puede representar valores de lógica binaria, esto es 2 valores, que normalmente representan falso o verdadero.

¡Nuevo!!: Tf-idf y Tipo de dato lógico · Ver más »

SalienteEntrante
¡Hey! ¡Ahora tenemos Facebook! »