Otros

Otros

Repositorio del IIE

Para el repositorio del Instituto de Investigaciones Económicas de la UNAM, hicimos un sistema que detecta la similitud entre los distintos documentos, a la vez que se proporciona una resumen de cada documento.

SAUTEE

SAUTEE es un sistema en web que cual permite al usuario analizar la aparición de diversos marcadores estilométricos en un conjunto de documentos de texto. SAUTEE analiza la aparición de varios marcadores estilométricos como lo son n-gramas de palabras, n-gramas de caracteres, medidas de vocabulario, etiquetas de parte de la oración entre otros. A partir de estos datos se crean vectores y se mide la distancia entre estos vectores para encontrar la similitud entre cada par de documentos. Los documentos que resulten cercanos unos tienen un estilo de escritura parecido.

SAUTEE se alimenta de los documentos de los corpus creados por medio del gestor de corpus GECO.

buscadores-y-extractores

SIMIL

Prototipo que permite encontrar la similitud de oraciones entre dos textos determinados. A diferencia de otros sistemas similares que detectan copy-paste, SIMIL permite encontrar paráfrasis.

MiOpERS

Minería de Opinión en Redes Sociales realiza la automatización para el análisis y la extracción de información en redes sociales. De ellos, se tiene un sistema automático de vigilancia de COVID19 mediante Twitter. que busca evaluar el comportamiento de las personas, estados de ánimo, la popularidad de las medidas del tomadas por el gobierno y síntomas de coronavirus.

Morfotáctica

Carlos Méndez Cruz, en su tesis de doctorado, propuso un método no supervisado de segmentación morfológica automática que infiere parte de la morfotáctica del español. Entre otros resultados, desarrolló un procedimiento que genera una gramática de estados finitos que describe dicha morfotáctica. En esta página se pueden visualizar los autómatas generados y sus bases, a partir del Corpus del Español de México Contemporáneo (CEMC).