阿里云
发表主题 回复主题
  • 469阅读
  • 0回复

大数据之梦十年后成真

级别: 论坛版主
发帖
41
云币
72
大数据之梦十年后成真

由于大数据面临七大难题以及对全国各家机构现有的信息系统进行全面改造非常困难,国家大数据之梦十年后才能成真。

大数据不仅仅是数据问题,而是非常复杂的综合问题。国家大数据并不是把各家机构现有的数据全部存贮到一个云平台就能称作是合格的国家大数据。要建立合格的国家大数据,需要对原有数据进行抽取,更需要对全国各家机构现有的信息系统进行全面整改。

信息化社会由概念到比较成熟用了30多年时间

“信息化”的概念是上世纪60年代初提出的。在80年代,关于“信息社会”的较为流行的说法是“3C”社会(通讯化、计算机化和自动控制化),“3A”社会(工厂自动化、办公室自动化、家庭自动化)和“4A”社会(“3A”加农业自动化)。到了90年代,关于信息社会的说法又加上多媒体技术和信息高速公路。“信息化社会”的概念从提出到比较成熟用了30多年,而时至今日,“信化社会”之梦还没有全部成真。

大数据的概念是2011年提出的,根据以往的经验,要创造一个时代,最起码以也十年以上的时间。

千年虫问题的启示

计算机2000年问题,又叫做“千年虫”、“电脑千禧年千年虫问题”或“千年危机”。缩写为“Y2K”。是指在某些使用了计算机程序的智能系统(包括计算机系统、自动控制芯片等)中,由于其中的年份只使用两位十进制数来表示,因此当系统进行(或涉及到)跨世纪的日期处理运 算时(如多个日期之间的计算或比较等),就会出现错误的结果,进而引发各种各样的系统功 能紊乱甚至崩溃。因此从根本上说千年虫是一种程序处理日期上的BUG,而非病毒。

“千年虫”问题的根源始于60年代。当时计算机存储器的成本很高,如果用四位数字表示年份,就要多占用存储器空间,就会使成本增加,因此为了节省存储空间,计算机系统的编程人员采用两位数字表示年份。随着计算机技术的迅猛发展,虽然后来存储器的价格降低了,但在计算机系统中使用两位数字来表示年份的做法却由于思维上的惯性势力而被沿袭下来,年复一年,直到新世纪即将来临之际,大家才突然意识到用两位数字表示年份将无法正确辨识公元2000年及其以后的年份。1997年,信息界开始拉起了“千年虫”警钟,并很快引起了全球关注。

“千年虫”是人类不经意造成的失误,为了抓住这只“虫”,全球至少已花费2000亿美元(有的媒体报道为3000亿美元,有的为6000亿美元)。

新年伊始,联合国“国际2000年问题协调中心”、美国的“国际‘千年虫’监控中心”等机构先后宣布,133个国家的能源、通讯等十几个对“千年虫”敏感行业都顺利过渡,仅十多个国家出现一些轻微案例,但均及时纠正,未造成严重后果。

全球唯一受“千年虫”严重影响的国家只有非洲的赞比亚,其政府、金融、电力、航空、服务一片混乱。政府宣布放假3日,避免社会功能瘫痪殃及其他系统。

有人称“千年虫”工程是人类最大的信息工程、人类最庞大的抢救工程。

大数据工程远比千年虫问题复杂

若用当前的技术如何处理国家医疗大数据?

首先是制订数据标准、数据结构标准,以及业务和业务流程的标准:这些工作的工程量非常大,需要五年左右的时间才能完成。目前虽说大家已认识到了标准化工作的重要性,但在实际行动上的力度还不够。

其次是数据抽取:对原有的数据进行抽取。若要对全国97.8万家医疗机构所产生的所有数据进行抽取,其工程量也是非常巨大的。这个抽取工作需要以国家医疗数据标准为基础。数据抽取工作也需要几年的时间才能完成。

第三是对现有信息系统的改造:只有对现有的信息系统进行彻底改造才能产生标准化的数据,这样才能适应大数据的需要。然而对全国各家医院的信息系统进行全面改造,所花费的代价是非常高的。到目前为止,各行各业的信息系统基本上都不标准,都不适应大数据的需求,对现有信息系统的改造的代价远远超对千年虫问题的处理。

第四是数据同步:对现有信息系统进行改造之后,数据要实时地同步到国家医疗大数据中心。

五年之内(2020年前)大数据只是纸上谈兵

五年之内,大数据还只是处于探索阶段、发展阶段。五年之后大数据才能逐步变成现实。从某种方面而言,五年之内(2020年前)中国没有真正合格的国家大数据。真正的合格的国家大数据是可以进行高效挖掘的数据,并不是把所有的数据堆集在一起就能称为国家大数据。不能进行高效处理、挖掘的数据只能称为“数据垃圾”,五年之后才能将“数据垃圾”变成宝。


本主题由 丸喵喵 于 2017-1-6 09:23 审核通过





云栖社区小编整理
大数据之梦十年后成真

由于大数据面临七大难题以及对全国各家机构现有的信息系统进行全面改造非常困难,国家大数据之梦十年后才能成真。

大数据不仅仅是数据问题,而是非常复杂的综合问题。国家大数据并不是把各家机构现有的数据全部存贮到一个云平台就能称作是合格的国家大数据。要建立合格的国家大数据,需要对原有数据进行抽取,更需要对全国各家机构现有的信息系统进行全面整改。

信息化社会由概念到比较成熟用了30多年时间

“信息化”的概念是上世纪60年代初提出的。在80年代,关于“信息社会”的较为流行的说法是“3C”社会(通讯化、计算机化和自动控制化),“3A”社会(工厂自动化、办公室自动化、家庭自动化)和“4A”社会(“3A”加农业自动化)。到了90年代,关于信息社会的说法又加上多媒体技术和信息高速公路。“信息化社会”的概念从提出到比较成熟用了30多年,而时至今日,“信化社会”之梦还没有全部成真。

大数据的概念是2011年提出的,根据以往的经验,要创造一个时代,最起码以也十年以上的时间。

千年虫问题的启示

计算机2000年问题,又叫做“千年虫”、“电脑千禧年千年虫问题”或“千年危机”。缩写为“Y2K”。是指在某些使用了计算机程序的智能系统(包括计算机系统、自动控制芯片等)中,由于其中的年份只使用两位十进制数来表示,因此当系统进行(或涉及到)跨世纪的日期处理运 算时(如多个日期之间的计算或比较等),就会出现错误的结果,进而引发各种各样的系统功 能紊乱甚至崩溃。因此从根本上说千年虫是一种程序处理日期上的BUG,而非病毒。

“千年虫”问题的根源始于60年代。当时计算机存储器的成本很高,如果用四位数字表示年份,就要多占用存储器空间,就会使成本增加,因此为了节省存储空间,计算机系统的编程人员采用两位数字表示年份。随着计算机技术的迅猛发展,虽然后来存储器的价格降低了,但在计算机系统中使用两位数字来表示年份的做法却由于思维上的惯性势力而被沿袭下来,年复一年,直到新世纪即将来临之际,大家才突然意识到用两位数字表示年份将无法正确辨识公元2000年及其以后的年份。1997年,信息界开始拉起了“千年虫”警钟,并很快引起了全球关注。

“千年虫”是人类不经意造成的失误,为了抓住这只“虫”,全球至少已花费2000亿美元(有的媒体报道为3000亿美元,有的为6000亿美元)。

新年伊始,联合国“国际2000年问题协调中心”、美国的“国际‘千年虫’监控中心”等机构先后宣布,133个国家的能源、通讯等十几个对“千年虫”敏感行业都顺利过渡,仅十多个国家出现一些轻微案例,但均及时纠正,未造成严重后果。

全球唯一受“千年虫”严重影响的国家只有非洲的赞比亚,其政府、金融、电力、航空、服务一片混乱。政府宣布放假3日,避免社会功能瘫痪殃及其他系统。

有人称“千年虫”工程是人类最大的信息工程、人类最庞大的抢救工程。

大数据工程远比千年虫问题复杂

若用当前的技术如何处理国家医疗大数据?

首先是制订数据标准、数据结构标准,以及业务和业务流程的标准:这些工作的工程量非常大,需要五年左右的时间才能完成。目前虽说大家已认识到了标准化工作的重要性,但在实际行动上的力度还不够。

其次是数据抽取:对原有的数据进行抽取。若要对全国97.8万家医疗机构所产生的所有数据进行抽取,其工程量也是非常巨大的。这个抽取工作需要以国家医疗数据标准为基础。数据抽取工作也需要几年的时间才能完成。

第三是对现有信息系统的改造:只有对现有的信息系统进行彻底改造才能产生标准化的数据,这样才能适应大数据的需要。然而对全国各家医院的信息系统进行全面改造,所花费的代价是非常高的。到目前为止,各行各业的信息系统基本上都不标准,都不适应大数据的需求,对现有信息系统的改造的代价远远超对千年虫问题的处理。

第四是数据同步:对现有信息系统进行改造之后,数据要实时地同步到国家医疗大数据中心。

五年之内(2020年前)大数据只是纸上谈兵

五年之内,大数据还只是处于探索阶段、发展阶段。五年之后大数据才能逐步变成现实。从某种方面而言,五年之内(2020年前)中国没有真正合格的国家大数据。真正的合格的国家大数据是可以进行高效挖掘的数据,并不是把所有的数据堆集在一起就能称为国家大数据。不能进行高效处理、挖掘的数据只能称为“数据垃圾”,五年之后才能将“数据垃圾”变成宝。

发表主题 回复主题
« 返回列表
«12345678910»
共10页
上一主题下一主题

限100 字节
批量上传需要先选择文件,再选择上传
 
验证问题: 4 + 57 = ?
上一个 下一个
      ×
      全新阿里云开发者社区, 去探索开发者的新世界吧!
      一站式的体验,更多的精彩!
      通过下面领域大门,一起探索新的技术世界吧~ (点击图标进入)

      版权声明

      开发者论坛为你提供“大数据之梦十年后成真”的内容,论坛中还有更多关于 2000之进行改造自动完成功根据出生年份 的内容供你使用,该内容是网友上传,与开发者论坛无关,如果需要删除请联系zixun-group@service.aliyun.com,工作人员会在5个工作日内回复您。