美国国会图书馆收录1700亿条Twitter推文
2013-01-05 13:56:51 来源: 评论:0 点击:
美国国会图书馆日前宣布已完成对Twitter现有全部推文(tweets)的收集,并已开始对多达1700亿条以上的推文进行存档和整理。
美国国会图书馆(以下简称“国会图书馆”)与Twitter在2010年达成了一项协议,由后者向前者提供所有公开推文的完整信息流。国会图书馆先是收录了2006年到2010年4月期间产生的210亿条推文,后来又补充了从那时起直至现在的1500亿条推文。
在一份公告中,国会图书馆将Twitter推文称为一种重要的新型馆藏资料,指出社交媒体作为当今社会不可或缺的沟通和表达方式,“对信件、日记、期刊以及其他馆藏资源形成了补充,有时甚至可以替代后者”。
国会图书馆还表示,尽管对Twitter推文档案尚未向研究人员开放,但是他们已经收到了来自世界各地研究人员的约400个查询请求,查询的主题涉及文化、政治、医疗、经济等诸多方面。
国会图书馆尚未透露Twitter推文档案的具体使用方法,但是已经就这一项目发表了一份白皮书,这份白皮书中称1700亿条推文的两份完整拷贝包含了多达133TB的数据。
分享到:
收藏