更新时间:2023-04-04 18:32
“大数据引擎(BIG ENGINE)”是百度公司2014年4月在第四届“技术开放日”活动上提出的概念。百度高级副总裁王劲在活动上正式宣布推出“大数据引擎”,通过三大组件——开放云、数据工厂、百度大脑,将百度的大数据能力开放给社会。
所谓大数据引擎,也称百度大数据引擎,指的是对大数据进行收集、存储、计算、挖掘和管理,并通过深度学习技术和数据建模技术,使数据具有“智能”。百度大数据引擎主要包含三大组件:开放云、数据工厂和百度大脑。
百度在开发和运营一整套自主研发的大数据引擎系统,包括数据中心服务器设计、数据中心规划和设计、大规模机器学习、分布式存储、超大规模集群自动化运维、数据管理、数据安全、机器学习(特别是深度学习)、大规模GPU并行化平台等方面,百度“大数据引擎”具有先进性和安全性。
百度大数据引擎包括开放云、数据工厂和百度大脑三个核心组件。百度将通过平台化和接口化的方式,对外开放其大数据存储、分析和智能化处理等核心能力,这也是全球首个开放大数据引擎。
据悉,百度的合作机构和传统企业,将能够在线使用百度的大数据架构,处理自身积累的大数据,同时融合百度大数据技术进行挖掘处理,改造传统行业的企业管理、商业模式等环节。
百度大数据引擎将经历逐步开放的过程,采取邀请制和免费模式,与政府、非政府组织、制造、医疗、金融、零售和教育等传统领域率先展开合作。
百度将基础设施能力、软件系统能力以及智能算法技术打包在一起,通过大数据引擎开放出来之后,拥有大数据的行业可以将自己的数据接入到这个引擎进行处理。同时,一些企业在没有大数据的情况下,还可以使用百度的数据以及大数据成果。
从架构来看,企业或组织也可以只选择三件套中的一样使用,例如数据存放在自己的云,但要运用百度大脑的一些智能算法应该也是支持的。举几个例子可能你更加清楚百度大数据引擎究竟是什么。
许多政府部门拥有海量大数据——大数据经典之作《大数据》也是在讲美国政府的大数据。但政府部门几乎都没有大数据处理和挖掘技术。交通部门有车联网、物联网、路网监控、船联网、码头车站监控等地方的大数据,卫生部门拥有流感法定报告数据、全国流感样病例哨点监测和病原学监测数据,公安部门有大量的视频监控数据。如果这些数据与百度的搜索记录、全网数据、LBS数据结合,在利用百度大数据引擎的大数据能力,则可以实现智能路径规划、运力管理、流感预测、疫苗接种指导、安防追逃等等。
许多企业也拥有海量大数据——通信、金融、物流、制造、农业等行业。不过,它们几乎都没有大数据能力,坐拥海量数据却一筹莫展。这时候如果能够应用百度大数据引擎,则可以对海量数据进行可靠低成本的存储,进行智能化的由浅入深的价值挖掘。在百度技术开放日上,中国平安便介绍了如何利用百度的大数据能力加强消费者理解和预测,细分客户群制定个性化产品和营销方案。
可以看出,大数据引擎的输入实际上是百度拥有的大数据以及行业已有的大数据,而输出则是各种行业应用成果,也就是大数据的“价值”。