奇幻城国际官网

官方微信:   
大数据开放的过程不可能一蹴而就,诸多问题依
时间:2017-12-22 09:51  编辑:admin
 

  开放大数据的过程不能一蹴而就,还有许多问题有待解决

  [IT时代网络,IT时代综合]​​大数据的普及给人们带来了质的变化。随着科学技术的发展和人们不断变化的需求,大数据的开放已经成为数据开发的重点之一。但是,这个过程不能一蹴而就。在开放大数据的过程中还存在很多问题。首先,多源数据水平参差不齐,可用性有待提高。开源数据源需要基于现有数据访问方法更多样化的数据收集方法,进一步提高数据收集的范围,频率和准确性。目前各子行业的收集手段难以统一。在不同行业生成数据的过程往往依赖私有化和定制设备。这也导致各行业对相同数据的解释存在广泛的不一致。影响公众数据梳理和聚合。例如,对于同一个数据源,不同的编码领域,存储类型和索引结构可以用于不同的行业。虽然数据的自然属性是独特的,但它们表现在各种技术手段上,人为地创造出“多样性”,使数据整合更加困难,严重降低数据的直接可用性。其次,数据模型滞后于衍生速度的应用。数据挖掘和挖掘的开放分析侧重于从传统单域分析到多域数据的综合分析。相应的数据模型也从平面模型结构变为数据模型立方体。规范和权威的数据模型将直接影响数据分析结果和战略决策的准确性。因此,缺乏高效可用的数据模型成为开放市场数据挖掘能力的瓶颈。另外,目前数据模型的生成和创新主要依赖于人工预设,人工智能,机器学习等传统方法,多源数据关联模型尚不成熟。高质量数据模型的推导速度不足以匹配应用迭代速度和业务场景对高需求的数据分析。第三,混合架构的存在需要关注顶级架构设计。一方面,数据源的多样化以及OLAP,OLTP等数据应用的现实需求,迫使企业设计基于混搭技术元素的复杂数据架构。另一方面,由于实际生产系统对传统企业的效率和准确性的影响,IT系统中“走向IOE”的过程相对缓慢和不完整。基于微型组织的Oracle数据库几乎不能完全取代。基础设施和数据的类型组织异构性也导致数据结构的长期混合。如何构建包含传统关系数据库,内存数据库和分布式文件系统的多元混搭体系结构,以满足企业数据需求,已经成为数据维护人员以开放格式设计顶层体系结构的一个新课题。第四,私有化和数据开放的自然矛盾不断升级。数据私有化不仅体现在数据持有者对原始数据的不断积累,而且体现在ETL等数据的私有化过程中。由于公司信息和用户隐私的保护,数据所有者通常将处理后的原始数据作为数据内容打开到上层应用程序,但是没有公开相应的数据处理转换规则。由于没有行业标准的统一指导,数据领域开放,领域的代码映射规则,数据处理的精度都导致应用程序提供者在数据开放中处于被动地位。但是,大多数数据分析工具并不能完美地整合数据隐私保护和数据共享。大数据魔术镜像是对团队合作的突破性支持,使企业能够一起分析数据并向数据添加隐私保护锁定。随着数据范围的不断扩大以及多领域数据相关成果的指数级增长,数据私有化的障碍效应将更加明显。但是,开放共享是数据开发的必要条件。这些问题在很大程度上限制了大数据的开放性。当然,所有对大数据未来抱有殷切期待的人都在试图解决这些问题。我相信今后开放大数据将突破局限,实现安全高效的开放。 [编辑/李环] IT时代网(关注微信公众号ITtime2000,常规推,与福利惊喜互动)全部原创文章版权所有Genesis 100创业投资基金成立于2015年,领导硅谷,专注于TMT的早期项目投资。 LP来自政府,互联网IT,知名媒体公司和个人。创科100多家IT,通讯,互联网,知识产权等创投基金拥有自己独特的视角和丰富的资源。快速的决策,快速的投资是100个基金制造商最显着的特点。翡翠村有一个年轻的花咀,人们只是设定了一个目标,谁说呢一定要做啊。支持董小姐来自:董明珠:卖5000万块格力手机是目标,不一定要实现 - IT管理员不要告诉我李彦宏是百度老板,老板和公司是不一样的伊琦伊是罗宾莉自己的投资呢。 。 。来自:iQIYI将于2018年上半年召开IPO百度继续持股之后 - 锐利 - IT网络青春村翠花翠每天的信息已经暴露在这个智能时代,没有真正的隐私来自:有没有最安全的产品WIFI WPA2协议漏洞 - 清晰度 - IT时代有没有必要争取年轻的村翠翠什么全屏的战斗,一个手机是她最重要的配置,不要把马车从前:为了全屏和配置成千上万的机器真的需要抢购这个行程时髦吗?锐利 - IT网络