偶数科技发布第四代数据仓库产品 完美契合AI应用
偶数科技发布第四代数据仓库产品 完美契合AI应用
曾几何时"流量为王",流量是互联网企业的核心竞争力。随着中国互联网进入数据时代,各大互联网企业从流量入口争夺逐渐向数据入口争夺转变,如何高效的管理、分析数据已经成为了越来越多互联网企业的核心。
偶数科技CEO常雷博士近日接受51CTO的专访时表示,新一代的数据库必须与AI大脑层面相对应,契合人工智能的应用场景,只有这样才能顺应技术发展规律,抢占数据时代先机。得益于对技术发展的敏感性和前瞻性,偶数科技得到了红点创投和红杉资本的青睐,并拿到了二者的融资。
数据库的演变
谈新一代数据库之前,我们先来简单回顾一下数据库的发展历史。从数据库系统发展的几十年期间,经历了第一代共享存储型数据库、第二代MPP型数据库以及第三代采用存储与计算分离架构的数据库。
·共享存储型数据库,为节省资源、降低开发者成本,出现了共享存储型数据库,不同的用户可以按各自的用法使用数据库中的数据;多个用户可以同时共享数据库中的数据资源,即不同的用户可以同时存取数据库中的同一个数据。传统的Oracle数据库等属于共享存储型数据库,也是最早的交易型数据库。
·MPP型数据库,是目前大量公司在使用的数据库,包括Teradata和Vertica等。因为操作系统和文件系统等底层基础不是很成熟,Teradata使用的是专有硬件,主攻软硬件一体机,并且更改了大量的操作系统以及文件系统代码。2000年左右出现了基于x86架构的MPP型数据库,包括Vertica,Greenplum等。这些基于x86架构的MPP型数据库使用的是普通服务器,没有专有硬件做支持,所以软件架构方面还是和Teradata类似。
·存储与计算分离架构数据库,这类数据库典型的代表有HAWQ和Hive等。第三代数据仓库的优点是可扩展性好,但是大部分引擎比如Hive等性能较差,兼容性不是很好,所以客户用起来很困难。
人工智能场景下HAWQ的新一代分析型数据库
偶数科技的CEO常博士表示,传统的分析型数据库在对数据进行在线统计、在线分析、随即查询等发掘信息数据价值的工作时有一定优势。但在人工智能场景中,面对海量数据分析型数据弊端逐渐显现,无论是反馈时长还是对设备性能严苛的要求,都已无法胜任人工智能场景的要求。因此对数据库进行迭代升级迫在眉睫。
在这样的大背景下,由偶数科技打造的基于HAWQ的分析型数据库应运而生,在人工智能海量数据处理上拥有得天独厚的优势。
第四代分析型数据库解决多领域数据处理核心难题
随着大数据和人工智能应用的层出不穷,对数据库的海量数据处理能力以及分析能力提出了更高的要求。无论是安防、金融亦或是制造业等等都对数据库性能提升产生了十分迫切的需求,而随着第四代分析型数据库的诞生,这个难题迎刃而解。
在人工智能的应用场景下,如安防领域,第四代数据库可以通过图像识别、人脸识别等进行更深层面的认知和推理;在人员身份的识别、人类轨迹分析等方面,可对视频、图片、电子车牌等不同种类的数据进行快速分析、碰撞、发现潜在联系,抽取有价值的信息,并对可疑行为发出预警对案件进行关联,协助提高公安部门案件的侦破效率。
针对实时数据等实际案例,如企业内部百万级别甚至千万级别的实时物联网传感器数据,第四代数据库完全摒弃了繁琐的Storm等方案,解决了大量编程和不能够完全适应物联网传感器数据的问题。
在金融领域中,银行原本需要对企业进行核查,然后再通过评委会进行评估,这些审核过程需要全人工操作操作。如果是小微贷款,由于信息较易获取,难度较小。而一旦涉及公司业务,那么银行就需要将该企业的所有外部数据以及内部数据按主题进行整合,不仅费时费力,还给人工分析时带来了巨大难度。
借助第四代数据库的技术优势,偶数科技可以利用数据存储、管理、分析以及人工智能算法建模,轻而易举的帮助客户构建模型流程以及模型的管理和上线,简化以前繁杂的审核过程,较少人工参与,缩短审核时间。
第四代分析型数据库的未来
常雷认为,不仅是刚刚提到的三个领域,在诸如电力、通信等众多基础领域也呈现出对于数据挖掘的巨大需求。同时,数据库应用需求的巨大变化预示着在数据库领域一场巨大的变革即将到来。
偶数科技在这个契机点推出了两款核心产品Oushu Database和LittleBoy,两者都基于业内领先的HAWQ技术研发,前者将满足数据库升级基础需求,而后者则将数据库技术推向了AI人工智能应用的未来。
在采访的最后,常雷博士表示"微软加速器第11期·北京对偶数科技帮助很大。一方面,研发上微软加速器第11期·北京和偶数科技已经达成了一些合作,偶数科技已经将产品移植到微软加速器第11期·北京的Azure公有云上;另一方面,微软加速器第11期·北京引荐了很多不同行业的客户资源,并且在管理、财务、招聘、PR 等方面的培训也对偶数科技进行了指导。"