Datasets

A continuación se muestra información sobre conjuntos de datos textuales en español creados con el objetivo de resolver tareas de PLN. En este caso, se trata de colecciones de textos, generalmente enriquecidas con anotaciones.

Filtrar por

Buscar palabras clave

Dominio

NLP topic

Idioma

Año

mCLAN-2025-es

Social
Español , Inglés , Árabe , Alemán , Francés , Hindi , Portugués
Publicado en 2025
4,336
Afirmaciones
detección de noticias falsas
HOMO-LAT-2025

Social
Español (Argentina) , Español (Bolivia) , Español (Chile) , Español (Colombia) , Español (Dominican Republic) , Español (Mexico) , Español (Peru) , Español (Uruguay)
Publicado en 2025
7,100
7100.00MB
detección de odio
TA1C 2024

Noticias
Español
Publicado en 2025
3,500
3500.00MB
Tuits
detección de clickbait
XC-Translate-2025-en-es

Diversos
Español , Inglés , Árabe , Alemán , Francés , Italiano , Coreano , Chino
Publicado en 2025
6,148
Pares de oraciones
traducción automática
MiSonGyny-2025

Español
Publicado en 2025
2,631
2631.00MB
detección de odio
The EA-MT dataset

Español , Inglés , Árabe , Alemán , Francés , Italiano , Coreano , Chino
Publicado en 2025
57611.00MB
traducción automática
Mu-SHROOM-2025-es

Diversos
Español , Inglés , Árabe , Alemán , Farsi , Francés , Hindi , Italiano , Sueco , Chino
Publicado en 2025
200
Wikipedia
generación de texto, factuality
PastReader-2025

Español
Publicado en 2025
12,195
12195.00MB
transcripción automática
MultiClaim-2025-es

Social
Español , Inglés
Publicado en 2025
7,581
Publicaciones de redes sociales
detección de noticias falsas
PolyHope-2025 V2

Social
Español , Inglés
Publicado en 2025
29,957
29957.00MB
Tuits
análisis de sentimiento
EXIST-2025-es-videos

Social
Español
Publicado en 2025
1,828
1828.00MB
detección de odio
semeval-2025-task11-emotions-es

Diversos
Español , Inglés
Publicado en 2025
3,875
análisis de sentimiento
Spa-DataBench

Diversos
Español
Publicado en 2025
300
300.00MB
sistemas de pregunta-respuesta
MultiClinSum-2025-es

Salud
Español
Publicado en 2025
998
998.00MB
resumen automático
MentalRiskES-2025

Salud
Español
Publicado en 2025
32,342
32342.00MB
elaboración de perfiles

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.