Herramientas para el análisis de texto


Para los interesados en el análisis de textos, les dejo algunas herramientas de Text Mining  que, como muchos ya saben, se usan, por ejemplo, para determinar las veces que se repiten palabras o frases dentro de un texto, y visualizar así algunas palabras dentro de este, analizando también otros patrones del mismo.

Basis Technology: Lenguaje natural la tecnología de procesamiento para el análisis de texto en varios idiomas sin estructurar (Comercial, multiplataforma).

Cypher: Un programa “disponible que genera el grafo RDF y SPARQL / representación consulta SeRQL de una entrada de un lenguaje sencillo, lo que permite a los usuarios hablar un lenguaje sencillo para actualizar y consultar bases de datos semánticas … Con lenguajes de definición de sólidos, la gramática de Cypher y léxico puede rápida y fácilmente ser extendido para procesar frases muy complejas y frases de cualquier lengua natural, y pueden cubrir cualquier vocabulario “(Libre, Windows / Mac OS X / Linux).

DICTION 5.0: Asistido por ordenador de análisis de texto para determinar el tono de un mensaje verbal: la seguridad, la actividad, el optimismo, el realismo y commonalty (Comercial, Windows).

IBM AeroText: “Un conjunto de aplicaciones de minería de texto que se utilizan para el análisis de contenido … Ejemplos de aplicaciones de destino incluyen la generación de bases de datos automática, enrutamiento de documentos, navegación, síntesis, búsqueda mejorada de texto completo y búsqueda específica de documentos, además de vincular el análisis” (Comercial, Windows / Linux / Solaris).

NORA: “Una aplicación de minería de texto destinado a permitir la exploración de patrones verbales en las colecciones de texto” (sustituida por el monje, el código fuente y demo disponible).

SEASR: Herramientas y marcos para el intercambio de datos y la investigación (incluyendo el análisis de texto) en entornos de trabajo virtuales (Libre, de código abierto, Windows / Mac / Linux)

Sintelix: Dispone de una amplia gama de características que le permiten configurar rápidamente los componentes de alta calidad de extracción de información para los flujos de trabajo. Utiliza tecnología nueva lengua propia, análisis de texto y los algoritmos de minería de textos para lograr una alta precisión a gran velocidad.

TACT: “Un texto de análisis y sistema de recuperación para MS-DOS que permite consultas en bases de datos de texto en las lenguas europeas” (Comercial, Windows DOS).


Enviar Comentario