分享好友 我来回答我要提问 技术交流首页 频道列表

大数据和大规模数据的区别

待解决1回答151点击

大数据和大规模数据的区别



离问题结束还有
反对 0
举报 0
收藏 0
暂无最佳答案    我来回答
big data之前学术界叫very large data,大数据和大规模数据的差距是什么?我认为在英文中large的含义只是体积上的,而big的含义还包含重量上的,价值量上的。因此我认为

1)大数据首先不是数量上的堆砌,而是具有很强的关联性结构性

比如有一种数据,记录了世界上每一颗大树每年长高的程度,这样的数据不具有价值,因为只是简单堆砌。

如果数据变成,每一个大树记录它的,地点,气候条件,树种,树龄,周边动植物生态,每年长高的高度,那么这个数据就具有了结构性。具有结构性的数据首先具有极强的研究价值,其次极强的商业价值。

在比如,淘宝的数据,如果只记录一个交易的买家,卖家,成交物品,价格等信息,那么这个商业价值就很有限。淘宝包含了,买家间的社交关系,购物前后的其他行为,那么这个数据将非常有价值。

因此,只有立体的,结构性强的数据,才能叫大数据,才有价值,否则只能叫大规模数据。

2)大数据的规模一定要大,而且比大规模数据的规模还要大

要做一些预测模型需要很多数据,训练语料,如果数据不够大,很多挖掘工作很难做,比如点击率预测。最直白的例子,如果你能知道一个用户的长期行踪数据,上网的行为,读操作和写操作。那么几乎可以对这个人进行非常精准的预测,各种推荐的工作都能做到很精准。
支持 0 反对 0 举报