博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据与死数据
阅读量:7260 次
发布时间:2019-06-29

本文共 1144 字,大约阅读时间需要 3 分钟。

大数据与死数据

为什么,在得知贵州还开办了大数据交易中心,也许是全球第一个

会觉得无比别扭??
连续发布了blog《大数据与郑国渠》、《大数据与黑天鹅》...
在blog中,笔者曾经提到:
积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?

4月30日,一周后,黑天鹅又一次出现:《中国科学家难以获取高质量的国内数据科学》

大数据是互联网、后资讯时代的产物。
而互联网的核心只有两个字:free(免费)+open(开放)
纽约的大学生,利用市政府的开放数据库,可以轻松制作出全市的犯罪热点分布图
而我们,就连专业科学家,都无法获得一手的数据,更何况商业应用了、BI开发。
也许,贵州的大数据交易中心,改为免费的、开源的数据共享中心,能够有一个华丽转身。

国内政府强推大数据,提升为国家战略的另外两个“潜在”考虑,可能是:
::基于大数据、信息科技的新型“计划经济”,个人对经济不熟悉,但直觉上觉得不靠谱,至少目前没看到有这方面的理论体系,而成熟的理论体系,是项目成功的基本要素。
  有了成熟的理论体系,未必一定成功,没有,绝对是失败
::建立类似1984的社会管理体系,这个更加不靠谱,网络危机公关的经典手法就是,采用大量的关联信息,淹没负面新闻。
   一组(10台)电脑,每天可以发布上亿条信息(包括填写验证码),可以模拟千万级的用户数据。
   (顺便说一句,个人是国内首家4A级网络公关公司的联合创始人之一,服务过150+国际500强,包括微软、奔驰、西门子)
  
   大数据的通道是互联网,数据、信息是一次性消费产品,可以零成本传播、复制,互联网的核心只有两个字:free(免费)+open(开放)
   积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?

 

中国科学家难以获取高质量的国内数据科学

上海海事大学的Zheng Wan在《自然》上发表文章称,中国科学家越来越难以获得高质量的国内数据,认为这一情况可能阻碍科研和创新。他说,大部分公共数据被政府部门控制,其中一些加强了对数据的垄断,使得中国研究人员难以获取这些数据。人文科学的研究人员受影响最大,但数据访问的限制正扩大到环境科学和公共健康等领域,原因是数据具有政治敏感性。即使数据公开了,其质量也令人担忧,最明显的一个例子是全国的GDP数据和各省公布的GDP数据之间存在显著差距,国家统计局称数据差异是数据收集方法的不同导致的。在文章最后,Zheng Wan谈论了互联网审查,称Google学术搜索被屏蔽对他的工作影响非常大。

 

转载于:https://www.cnblogs.com/ziwang/p/9500411.html

你可能感兴趣的文章
Day4 MySql触发器视图索引以及设计优化
查看>>
Oracle内存管理(之四)
查看>>
js bind 绑定this指向
查看>>
Apache Shiro 使用手册(二)Shiro 认证
查看>>
SQL Server修改标识列方法(备忘)
查看>>
Spring中Mybatis的花样配置 及 原理
查看>>
malloc原理和内存碎片【转】
查看>>
文档的js
查看>>
React Props
查看>>
ELK+Filebeat+Kafka+ZooKeeper 构建海量日志分析平台
查看>>
Android接口和框架学习
查看>>
获取表单select域的选择部分的文本
查看>>
Linux 下socket通信终极指南(附TCP、UDP完整代码)
查看>>
Python常用模块-摘要算法(hashlib)
查看>>
小程序flex属性两边边距自适应
查看>>
缓存更新的套路
查看>>
Disconf 学习系列之Disconf 的功能特点
查看>>
leetcode 695. Max Area of Island
查看>>
spring3: 对JDBC的支持 之 关系数据库操作对象化
查看>>
Android已有的原生Camera框架中加入自己的API的实现方案。
查看>>