clasificación de textos
DIPROMATS
- Lee más sobre DIPROMATS
- Inicie sesión o registrese para enviar comentarios
El conjunto de datos DIPROMATS 2024 está diseñado para el análisis de la propaganda en redes sociales, abordando tanto las técnicas utilizadas como las narrativas subyacentes. Contiene tuits anotados manualmente en varios idiomas y estructurados en tres niveles de análisis: detección binaria de propaganda, clasificación en tres grupos de técnicas propagandísticas y categorización detallada en siete técnicas específicas. Además, incluye una tarea de clasificación multiclase y multietiqueta para identificar narrativas propagandísticas asociadas a actores internacionales.
RepLab-2014-Reputation
- Lee más sobre RepLab-2014-Reputation
- Inicie sesión o registrese para enviar comentarios
RepLab-2014-Profiling
- Lee más sobre RepLab-2014-Profiling
- Inicie sesión o registrese para enviar comentarios
MLDoc-ES
- Lee más sobre MLDoc-ES
- Inicie sesión o registrese para enviar comentarios
Tweets emojis-ES
- Lee más sobre Tweets emojis-ES
- Inicie sesión o registrese para enviar comentarios
ADoBo
- Lee más sobre ADoBo
- Inicie sesión o registrese para enviar comentarios
MEDDOPROF
- Lee más sobre MEDDOPROF
- Inicie sesión o registrese para enviar comentarios
DIPROMATS-ES 2023
- Lee más sobre DIPROMATS-ES 2023
- Inicie sesión o registrese para enviar comentarios
DIPROMATS ES 2023 está compuesto por tuits en español escritos por diplomáticos. Incluye 9591 tweets, 2997 de ellos publicados por 25 autoridades chinas, 1391 por 22 autoridades rusas, 2465 tweets fueron publicados por 48 autoridades europeas y 40 autoridades de Estados Unidos proporcionan 2738 tweets. Las anotaciones proporcionan información sobre si un tweet contenía técnicas de propaganda, 4 grupos de técnicas de propaganda, 15 tipos de técnicas de propaganda.
ClinAIS 2023
- Lee más sobre ClinAIS 2023
- Inicie sesión o registrese para enviar comentarios
El corpus ClinAIS es un subconjunto seleccionado al azar del corpus CodiEsp de fondo, que consta de 1038 notas clínicas distintas anotadas con siete tipos de secciones médicas de las notas.