自首台计算机ENIAC诞生起,人们便对数据收集、整理、分析和使用产生了高度依赖。
这种依赖随着数据应用的不断扩展,逐步发展到数据驱动与转化阶段。
那些有志于在数字化转型中先拔头筹的企业深知,数据驱动与转化意味着庞大的数据资源必将通过计算、交互产生智慧与财富。
而另一方面,企业也看到前所未有的挑战近在咫尺:数据应用呈现出大规模、多元异构、跨行业、实时联动等形态,此场景的背后则是数据接入难、分析难、消费难的“三难”窘境。
根据华为全球产业展望(GIV)报告显示,全球数据量将从2018年32.5ZB快速增长到2025年的180ZB。
与之形成对比,企业生产活动产生的数据中只有不到2%被保存,而其中得到分析利用的不足10%,显然,数据价值的充分释放距理想状态相去甚远。
正视数据“三难”
在如何科学而有效的利用数据潜在价值这一问题上,不乏用户端的声音—来自金融行业的某企业CIO曾这样评价:若要从根本上解决企业面临的数据三难,应当具备“两重视”、“+智能”的应用思维。
所谓“两重视”,即重视数据“主权”与数据“提纯”,前者旨在强调企业对数据湖中的数据资源实现主导,并全方位掌握数据的流向与接入,其重要性不言而喻—让数据百分之百地满足自身业务所需;而后者旨在强调数据的精确应用,让有效数据对接明确需求,高效精准的使能业务成长。
其次便是“+智能”!顾名思义,通过基于多样算力的AI技术,将杂乱而无序的海量关联数据实现智能聚合、分析,形成精准化、有序化、结构化的数据,数据应用的场景价值才会由此得以全面释放。
FusionData,华为新近发布的智能数据解决方案,显然并有意从上述应用需求中切入,力求点亮客户在数据应用道路上的新锐脚步—强有力的迈向智能数据的大产能时代。
正如华为Cloud & AI产品与服务总裁侯金龙于FusionData发布会现场所言:“数据成为新生产资料,智能成为新生产力,企业需要构建领先的数据基础设施,从而打通数据供应全流程,使能数据与业务全连接,提升业务敏捷性!
侯金龙的语义背后或许还存在另一提示—各种经济时代的区别,不在于生产什么,而在于用什么生产资料,怎样生产。
FusionData即是数据大产能时代最需要的生产工具,而它的使命即是基于数据资料,完成对数字化转型的数据使能!
与之相呼应,FusionData的特质也确有“一切源于数据,高于数据”深刻意味。
源于数据—FusionData从数据服务需求的根本—(数据汇聚)出发,通过聚合数据源,提供‘采-存-算-管-用’全生命周期管理能力,让数据存得下、流得动、算得快、用得好,助力客户将数据资源转变为数据资产。
高于数据—FusionData将数据的应用提升到万物互联的智能世界之上。而FusionData的终极目标则要实现一家企业一个数据湖,一座城市一个数据湖,满足居民的生产与生活、企业的运营和发展、城市政府的管理和服务等各项需求,加速全社会的智能化进程。
在FusionData发布会现场,华为IT产品线副总裁、智能数据与存储领域总裁周跃峰,用数据服务的线性图形将FusionData的“完美实力”展现于业界。
笔者的直观感受是:有高度、够清晰、全方位地触达到数据服务的各项能力环节。FusionData重定义着数据基础设施,其声量可谓振聋发聩,而其精彩内容包括:底层多样性算力平台、数据接入、存储、处理以及使能项。
其中,结合FusionData的特质,令华为引以为傲的三项重点—聚焦于数据接入、数据处理和数据使能三个层面,力图通过“连接”、“处理”、“使能”三个关键词让用户明白,任何复杂、异构、海量的数据难题都能在华为FusionData的全生命周期的管理能力下一一化解,同时还有意外“惊喜”。
FusionData的实力与惊喜
下文便通过三个关键词在细节上对FusionData做出一番简要总结,一窥其实力与惊喜之处。
“连接”:多样与高效
要做到企业用户理想中的数据智能全连接并非易事,因为只要让数据连接就意味着要与多源异构数据深度关联,后者直接引发的结果即是割裂的数据孤岛,而数据孤岛还是非统一,且形态各异。
事实上,传统的数据融合接入方式处理的对象多聚焦在来源相同、结构类似、维度单一的数据单元。而面对两多一异(多源、多维、异构)的数据源,华为选择了智能数据连接部件ROMA完成对多数据源接入、消息和API的统一管理,同时智能通道选择等技术实现智能全连接,加速数据流动,让应用与数据连接更高效。
形象地说,FusionData的全智能“连接力”做到了让数据湖在“海纳百川”中“浑然一体”,且“四通八达”。
所谓“海纳百川”即是在接入能力上,FusionData做到了支持1100多种应用和异构数据源接入,通过开放式数据接入框架可灵活接入第三方数据源。最大限度地容纳数据多样性,找到各类数据的平衡点,让各类数据相互融合的同时将其本色充分保留,并完美地体现在分析应用管道中。
做到“浑然一体”旨在强调界面式的一触即达,即基于统一的管理平台实现分布式消息和API服务的跨网跨域跨云集成,让数据自由流动的同时提升数据应用的效率。
不忘提及的一项重点是针对跨网跨域跨云集成,华为在云、管、端的基础设施平台上具备了其它业界友商并不完全具备的核心优势,这一点,华为已拔得头筹。
实现“四通八达”,则是来自智能通道的选择,即支持数据多通道传输,并且可根据数据特点智能选择传送通道,大幅提升数据接入效率。
“处理”-重定义数据智能化
尽管FusionData是作为智能数据整体解决方案亮相于业界,但其光芒仍然被其两个重要组件-业界首创的 AI Native 分布式数据库 GaussDB 和分布式存储产品 FusionStorage 8.0所占据。
两大角色性格分明:GaussDB将 AI 技术引入数据库,大幅提升数据库自动化管理和优化能力;FusionStorage 8.0则实现一套存储系统同时支持块、文件、对象、HDFS、数据库协议,适用于全业务场景混合负载,满足云上云下数据流动并保障一致性体验。
两者再搭配FusionInsight,通过多类型数据融合存储、融合分析引擎完成了从单一处理到智能融合处理,加速了数据价值的转化。综合而言,三者结合极大提升数据处理平台的速度,即处理数据的效率;宽度,数据应用的范围得以扩展;能力,处理数据的质量直接提升。
作为FusionData的一大灵魂角色,GaussDB在此值得为其浓墨重彩一番,这主要得益于其极为抢眼的创新表现力:其作为首个将AI技术融入分布式数据库的全生命周期中的 AI-Native数据库,一并实现了自运维、自管理、自调优、故障自诊断和自愈,形成了自家独特的数据库内生管理力;其次,作为首款支持ARM架构的企业级数据库,更能充分发挥X86、GPU、NPU的综合算力优势,在算力出口上不存在桎梏,也无配额,而是实现计算资源配置价值的最大化释放。
周跃峰给出的GaussDB成绩单令关注华为数据库产品的用户与合作伙伴倍感振奋—基于深度强化学习的自调优算法,其调优性能比业界标准提升 60% 以上;根据权威标准测试集 TPC-DS 进行测试,GaussDB性能比业界提升 50%,排名第一,当然,与GaussDB相匹配的成绩表现仍有很多,不在此赘述。
值得强调的一点是,GaussDB搭载的融合分析引擎,能够做到支持数据库、大数据、AI多引擎融合分析和多样性算力统一调度,实现极简分析。
使能-数据先感知再驱动
使能数据,即通过智能技术加速数据的提纯,并快速转化其潜在价值。这一过程,用户需要考虑在海量、异构数据中如何让信息能够精准地触达应用所需,而不至于埋没在数据洪流中。简而言之,选择有效数据,淘汰无效数据,但此项工作并不轻松—基于数据平台工具对数据进行感知、过滤再实现筛选。
FusionData中,智能元数据感知功能便通过AI技术,自动感知和采集多个系统的元数据,对数据进行智能化分级分类,生成全局统一的数据视图,零数据归纳、筛选达到秒级响应。其遵循数据提纯的精准、合理即有效性原则,避免了用户对海量数据提纯的劳力费神。
而接下来的数据加工流程中,FusionData提供了OneQuery Tuobo工具,让数据访问接口实现统一,实现多数据源、多类型数据的统一访问,简化数据加工流程,数据获取速度提升10倍以上。
FusionData的生态家园
不容否认,数据应用的本质是信任与共享。FusionData生态发展同样如此。
诠释“信任”,华为智能数据解决方案FusionData已经应用于全球60多个国家及地区,服务于1500多个客户,拥有500多家商业合作伙伴,并广泛应用于金融、运营商、政府、大企业等行业。这一连串的数字表明,FusionData已成为业界用户与伙伴极为信任的数据服务方案品牌。
诠释“共享”,华为生态圈的各个参与者共享着数据创新所带来的回报,其不仅体现在业务层面,更体现在携手共赢之处—华为正在联合客户和合作伙伴,从行业应用、平台工具、标准组织和社区三个层面完善产业生态,让FusionData在真正的数据应用共同体的道路上走得更宽,更远。
如果向华为生态圈的伙伴们问及对FusionData的深刻印象,答案一定是:源于数据,高于数据。