大数据与死数据
为什么,在得知贵州还开办了大数据交易中心,也许是全球第一个
会觉得无比别扭?? 连续发布了blog《大数据与郑国渠》、《大数据与黑天鹅》... 在blog中,笔者曾经提到: 积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?4月30日,一周后,黑天鹅又一次出现:《中国科学家难以获取高质量的国内数据科学》
大数据是互联网、后资讯时代的产物。 而互联网的核心只有两个字:free(免费)+open(开放) 纽约的大学生,利用市政府的开放数据库,可以轻松制作出全市的犯罪热点分布图 而我们,就连专业科学家,都无法获得一手的数据,更何况商业应用了、BI开发。 也许,贵州的大数据交易中心,改为免费的、开源的数据共享中心,能够有一个华丽转身。 国内政府强推大数据,提升为国家战略的另外两个“潜在”考虑,可能是: ::基于大数据、信息科技的新型“计划经济”,个人对经济不熟悉,但直觉上觉得不靠谱,至少目前没看到有这方面的理论体系,而成熟的理论体系,是项目成功的基本要素。 有了成熟的理论体系,未必一定成功,没有,绝对是失败 ::建立类似1984的社会管理体系,这个更加不靠谱,网络危机公关的经典手法就是,采用大量的关联信息,淹没负面新闻。 一组(10台)电脑,每天可以发布上亿条信息(包括填写验证码),可以模拟千万级的用户数据。 (顺便说一句,个人是国内首家4A级网络公关公司的联合创始人之一,服务过150+国际500强,包括微软、奔驰、西门子) 大数据的通道是互联网,数据、信息是一次性消费产品,可以零成本传播、复制,互联网的核心只有两个字:free(免费)+open(开放) 积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?
中国科学家难以获取高质量的国内数据科学
上海海事大学的Zheng Wan在《自然》上发表文章称,中国科学家越来越难以获得高质量的国内数据,认为这一情况可能阻碍科研和创新。他说,大部分公共数据被政府部门控制,其中一些加强了对数据的垄断,使得中国研究人员难以获取这些数据。人文科学的研究人员受影响最大,但数据访问的限制正扩大到环境科学和公共健康等领域,原因是数据具有政治敏感性。即使数据公开了,其质量也令人担忧,最明显的一个例子是全国的GDP数据和各省公布的GDP数据之间存在显著差距,国家统计局称数据差异是数据收集方法的不同导致的。在文章最后,Zheng Wan谈论了互联网审查,称Google学术搜索被屏蔽对他的工作影响非常大。