fake news detection

MultiClaim-2025-es

Este conjunto de datos consiste en verificaciones de hechos, publicaciones de redes sociales y emparejamientos entre ambos. Incluye 205.751 verificaciones de hechos en 39 idiomas y 28.092 publicaciones en redes sociales en 27 idiomas. Todas las publicaciones han sido previamente revisadas por verificadores profesionales, que también les asignaron las verificaciones correspondientes. Hay 31.305 pares de verificación-publicación, y cada publicación está asociada con al menos una verificación. De estos pares, 26.774 son monolingües y 4.212 son multilingües.

CT–CWT–23-ES

The dataset focused on three topics: COVID-19, climate change and technology. The Spanish dataset is a combination of CT-CWT-21, CT-CWT-22 and newly collected content. It is composed of tweets collected from Twitter accounts and transcriptions from Spanish politicians, which are manually annotated by professional journalists who are experts in fact-checking. Each tweet was labeled using both the image and the text.