Awesome Public Datasets
UCI Machine Learning Repository
机器学习常用数据集
-数据堂
买卖数据,部分免费。
北京城市实验室(BCL)开放数据 ,
GDELT项目 谷歌也参与了该计划,并开放了一个 Google BigQuery数据集,包括两亿五千万的Event数据, 以及Global Knowledge Graph。
斯坦福词向量
中文停用词