实时数据仓库(real-timedatawarehose,rwd)是一种以数据仓库技术为基础、面向主题的数据集市。它通过实时地访问数据库中的数据来满足企业快速决策的需要。实时数据仓库是建立在传统关系型数据库基础上的一个全新的概念,其基本思想是将传统的静态的、结构化的数据和半结构化或非结构化的数据统一到一个统一的平台上进行管理。
实时性要求对数据的采集和加工过程必须做到及时、迅速;同时,由于实时性要求高并涉及多个业务系统之间的协调问题,所以需要建立多维度的集成平台来支持这种需求。
构建实时数据仓库的主要步骤包括:
1. 确定目标用户群及分析用户需求
在建设之前首先要明确企业的目标客户群体以及他们的主要特征是什么?比如:哪些是企业内部的员工?他们有什么样的特点?这些特点会对企业产生什么样的影响等?
2. 确定应用场景
根据上述分析结果确定要开发的应用场景有哪些类型?例如:生产型企业有采购订单处理流程;零售业有销售订单处理和库存管理等;物流行业有运输配送流程等等。
3. 建立模型
通过对以上两个步骤的分析可以得出一些基本的结论,即企业在不同应用场景下会面临哪些不同的风险因素和机会点等。在确定了这些关键信息之后就可以根据具体的情况建立相应的数学模型了。
4. 开发工具
选择合适的软件开发工具也是非常重要的一个环节!因为只有选择正确的软件工具才能保证项目的成功实施与上线运行!目前市场上有很多成熟的解决方案可供大家选择!如sap hana saas产品就是一款非常不错的开源软件产品
5. 实施部署
将已经设计好的方案交给实施团队开始实施部署工作
6. 测试评估
最后将测试的结果反馈给研发部门进行进一步的改进和完善
以上五个方面是笔者认为建设好一个完整的实时大数据平台的几个关键点!当然在实际项目中可能还会涉及到其他很多方面的内容和技术难点这里就不做赘述了!