Content builder
Se busca sistematizar las fichas de búsqueda de personas desaparecidas de las 32 entidades federativas para dimensionar el fenómeno de la desaparición de personas en el país en los últimos 10 años. El proyecto busca explotar los avances recientes en procesamiento de imágenes, extracción de información y representaciones vectoriales de texto, para incorporar diversas fuentes de datos al análisis de esta severa problemática.
Experiencia en programación en lenguaje Python. Experiencia con la biblioteca Pandas y con el sistema de control de versiones Git son necesarias, y familiaridad con las bibliotecas PyTorch o Tensorflow son altamente deseables. La revisión de literatura será en idiomas español e inglés, lo mismo que la redacción de los productos de investigación.
21 semanas
2 estudiantes de Ciencias de la Computación
Durante este proyecto se desarrollarán un conjunto de herramientas de procesamiento de lenguaje natural que permitirán cuantificar el panorama de los distintos enfoques con los que se aborda un problema en la literatura. En breve, se proyecta la elaboración de clasificadores de texto que permitan identificar enunciados en los que una persona autora provea una explicación a un fenómeno y, subsecuentemente, organizar estos enunciados en una taxonomía de posiciones epistémicas, es decir, de enfoques y abordajes del problema. Se desarrollarán clasificadores “few-shot” tanto a nivel enunciado como palabra, para extraer y etiquetar enunciados en un corpus grande de texto.
Experiencia en programación en lenguaje Python. Experiencia con la biblioteca Pandas y con el sistema de control de versiones Git son necesarias, y familiaridad con las bibliotecas PyTorch o Tensorflow son altamente deseables. La revisión de literatura será en idiomas español e inglés, lo mismo que la redacción de los productos de investigación.
21 semanas
2 estudiantes de Ciencias de la Computación
Dr. Víctor Mireles Chávez
CEIICH, UNAM.
victor.mireles@ceiich.unam.mx