数据中台数据中台
申请试用
新闻动态
了解袋鼠云最新动态
新闻动态>「数据服务引擎」阿里的数据服务引擎ODPS有哪几个板块?>
「数据服务引擎」阿里的数据服务引擎ODPS有哪几个板块?
2020514|文章来源:-

阿里的数据服务引擎ODPS有哪几个板块?ODPS(Open Data Processing Service)开放数据处理服务是对海量且实时要求不高的OLAP应用。主要是构建数据仓库,数据挖掘和商业智能应用。

阿里的数据服务引擎ODPS有哪几个板块? 1、基础构造

客户能够根据云端等UI页面递交SQL或是MR等每日任务,还可以用命令行工具ODPSClient开展实际操作,最底层全是根据ODPSSDK和ODPSRESTAPI服务项目通讯。数据通道则是根据命令行工具dship等,最底层是根据ODPSTunnelSDK和ODPSProtocalbufferAPI服务项目通讯。适用的测算包含:SQL根据SQL92适用Python和Java的自定义函数UDF等,MR,DAG程序编写实体模型,Graph程序编写实体模型用以大信息量的图计算,举例说明:PageRank;XLib出示SVD溶解,逻辑回归、任意森林等分布式系统优化算法,用以设备学和大数据挖掘。

阿里的数据服务引擎ODPS有哪几个板块?2、伏羲系统软件

伏羲测算服务平台承担任务调度和资源优化配置,每一个Service起动先运作一个ServiceMaster,承担向FuxiMaster申请办理資源和生产调度ServiceWorker到資源设备,伏羲适用DAG实体模型的任务调度。这一也就是近期阿里云服务器在sortbenchmark得到总冠军的关键,关键设计方案是NetworkShuffer的全过程:在Shuffle环节,Map在明确了Partition后,不开展Buffer内排列,只是立即根据互联网发送给相匹配的Reduce端,那样Reduce接受的数据信息是混乱的,就需要先Buffer内排列也会Dump到本地文件中,最终开展一次合并Merge转化成一个大井然有序文档出示Reduce读取,那样的设计方案大大的减少了数据信息落盘的IO。

阿里的数据服务引擎ODPS有哪几个板块?3、盘古系统

盘古开天是分布式存储,主要是确保极可扩展性。数据信息选用3团本储存方法;数据库选用多Master(1主2备)的体制,Master数据库也选用运行内存储存,根据快照更新和系统日志确保关闭电源修复。数据库的一致性根据Paxos优化算法来确保。

免费试用袋鼠云数字化基础软件,开启企业数字化增长之旅
免费试用袋鼠云数字化基础软件,开启企业数字化增长之旅
袋鼠云立体IP
在线咨询
在线咨询
电话咨询
电话咨询
微信社群
微信社群
资料下载
资料下载
返回顶部
返回顶部