我的博客

T4SA Dataset 介绍

目录

http://www.t4sa.it/

来自 2017 年的论文 Cross-Media Learning for Image Sentiment Analysis in the Wild。

在网站上提交一个表单可以获得用于下载的用户名和密码。

这个数据集提供 5 个文件下载。除了原数据集 T4SA 还有一个 B-T4SA 是从 T4SA 中挑选出来的种类平衡的子集。

T4SA 有 117 万条 twitter,147 万图片。B-T4SA 有 15 万图片。

该论文还使用另一个数据集做测试:

https://www.cs.rochester.edu/u/qyou/DeepSent/deepsentiment.html

这个数据集似乎是只有图片。使用多种算法给图片打标签,把有多个模型得到相同结果的图片作为有标记的数据。

2019 年的文章 A Multimodal Approach to Image Sentiment Analysis 也使用了该数据集。并提出一种结合文字与图片信息判断情感的方法。

还有类似的数据集:

http://www.ee.columbia.edu/ln/dvmm/vso/download/twitter_dataset.html

605 个图片(也包含一些推文和评论)

评论无需登录,可以匿名,欢迎评论!