Hermetic Word Contador de Frecuencias

Cuenta Frecuencias de Palabras Diferentes en un Archivo

Esta es una traducción al Español de https://www.hermetic.ch/wfc/wfc.htm

Hermetic Word Frequency Counter escanea un archivo MS Word docx o un archivo de texto, incluidos archivos HTML y XML codificados mediante ANSI o UTF-8, y cuenta el número de ocurrencias de las diferentes palabras (opcionalmente ignorando palabras comunes como la y esto ). Por lo tanto, también es un programa de búsqueda de palabras. Es posible especificar exactamente lo que cuenta como una palabra (por ejemplo, palabras con o sin guiones o números). Las palabras que se encuentran se pueden enumerar alfabéticamente o por frecuencia, con el recuento de rango y frecuencia que se muestra para cada palabra.
Hay dos versiones de este software de recuento de palabras: básico (WFC) y avanzado (WFCA, que hace todo lo que WFC hace, incluido el escaneo de archivos docx ). Las diferencias principales son que WFC cuenta palabras solo en archivos docx, de texto y texto, mientras que WFCA cuenta palabras en múltiples archivos (en varias carpetas) en una sola operación y también cuenta frases. Si necesita contar palabras en un solo archivo a la vez, entonces WFC puede ser lo que necesita. Si tiene muchos archivos o necesita más opciones y una mayor funcionalidad, entonces necesita WFCA. Haga clic en este enlace para la página de WFCA .
Para abrir un archivo, haga clic en el botón Archivo de entrada (Input File) y navegue a la carpeta y archivo deseados. Después de configurar los parámetros de operación , haga clic en el botón Contar palabras (Count Words). Aquí hay una captura de pantalla típica, que muestra recuentos de palabras para un archivo de texto de 540,80 Kb, con palabras comunes ignoradas, mayúsculas y minúsculas distinguidas, y las palabras ordenadas por frecuencia:

Aquí hay una captura de pantalla típica:

Aquí hay otra captura de pantalla que muestra recuentos de palabras para un archivo docx MS Word de 187.62 Kb (el texto mismo, cuando se desempaqueta, es 340.88 Kb), con palabras comunes ignoradas, mayúsculas/minúsculas no distinguidas y las palabras ordenadas de nuevo por frecuencia:

En ambos casos, el proceso tomó menos de 20 segundos. Eso es con la casilla de verificación No mostrar las palabras como encontradas (Don’t display words as found) marcada. Si no se selecciona, el procesamiento es mucho más lento porque el cuadro de texto debe actualizarse siempre que se encuentre una nueva palabra.

Teóricamente no hay límite en el tamaño de un archivo de entrada o el número de palabras en él, pero en la práctica (debido al tiempo de procesamiento necesario) hay un límite de alrededor de 10 Mb en archivos de texto (y archivos tipo texto como XML) y archivos HTML).

También hay un límite de aproximadamente 10 Mb en la cantidad de texto en un archivo docx de MS Word (aunque un archivo docx puede ser más grande si contiene muchas imágenes). Para un archivo docx , solo se cuentan las palabras en el cuerpo del documento, no las palabras en notas al pie o notas al final.

ANSI es la codificación de texto de un solo byte que es la codificación predeterminada en su PC. UTF-8 es una codificación de longitud de bytes variable de caracteres Unicode, a menudo utilizada en archivos HTML y XML.

Para los archivos de texto y texto (incluidos los archivos HTML y XML), el texto puede estar codificado a través de ANSI o UTF-8. No actúa directamente sobre archivos binarios como archivos de doc pdf y MS-Word (a diferencia de los archivos docx ); tales archivos se pueden escanear si se guardan como archivos de “Texto sin formato” (ver  Archivos Escaneables ). El programa cuenta las frecuencias de todas las palabras en el archivo (u opcionalmente todas las palabras que no sean palabras comunes). Si solo desea contar las ocurrencias de una sola palabra (o de cada palabra en un conjunto de palabras, o de cualquier palabra que coincida con un patrón dado ), puede hacerlo con la Versión Avanzada de este programa.

Los valores de “rango” y “frecuencia” pueden ser incluidos o excluidos de los resultados mostrados. 

Si el archivo de salida consta únicamente de palabras, sin valores de recuento de frecuencia o rango, puede obtenerlos como una lista (una palabra por línea) o como separados por comas. Esto se hace haciendo la selección apropiada en el menú desplegable Formato de visualización .

El archivo de entrada no necesita consistir simplemente en texto en lenguaje natural, sino que puede ser un archivo HTML, XML, PHP o C / C ++, o puede mezclar lenguaje natural con etiquetas como “<table>”.

Al procesar archivos HTML, se omiten etiquetas HTML como “<center>”. Al procesar archivos XML, se salta todo el texto dentro de “<” y “>”. Los archivos PHP se procesan como archivos HTML en los que son posibles los comentarios tipo C. Al procesar archivos PHP, el texto dentro de “<? Php” y “?>” No se salta.

Hermetic Word Frequency Counter Manual de Usuario

Versión de prueba: una copia del programa de instalación Hermetic Word Frequency Counter puede descargarse libremente de este sitio web para fines de evaluación. Haga clic en el siguiente enlace para obtener más información:

Descargar Hermetic Word Frequency Counter …

Precio y pedido: una licencia de usuario único para el software completamente funcional está disponible por un período de 3 meses, 1 año o sin límite de tiempo (una licencia ‘perpetuo’). Los precios de cada tipo de licencia se otorgan al comprar una licencia de usuario. Se requiere una clave de activación para que la versión de prueba sea permanentemente funcional y se puede obtener inmediatamente (o poco después) de su compra.

Reembolso: se proporcionará un reembolso puntualmente hasta 30 días después de la compra si el software no funciona satisfactoriamente.

Actualizaciones: los compradores de una licencia de usuario para este software tienen derecho a una actualización de cualquier versión posterior sin costo adicional.

Actualización a la versión avanzada: Los compradores de una licencia de usuario perpetua para el Contador de frecuencia de Word Hermetic pueden actualizar a una licencia de usuario permanente para la Versión avanzada pagando $ 34.95 (aproximadamente € 27.95 o £ 24.45). Para comprar la actualización, haga clic en el botón de abajo. Tenga en cuenta que esto sólo está disponible si una licencia de usuario único perpetua para hermética Palabra contador de frecuencia ha ya sido comprado.