400-002-1024

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

2019年5月23日 袋鼠云 文章来源:袋鼠云

1

一句话了解DTinsight.Science

DTinsight.Science是「可视化建模与交互式代码编写于一体的机器学习作业探索平台」,实现数据接入、可视化实验建模、Notebook编程、模型训练、模型部署、任务运维等开发场景,帮助企业构建算法服务能力,提供高效、安全、稳定的算法运行环境。

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

使用数栈-数据科学平台DTinsight.Science

进行一站式数据探索

 

划重点!

 

  • 数栈-数据科学平台 DTinsight.Science是什么:
    机器学习作业探索平台

     

  • 数栈-数据科学平台 DTinsight.Science的产品目标是:
    提供专业、可靠、高效的算法建模平台,一站式完成算法建模、模型训练、模型部署等机器学习作业,让数据智能触手可及。

     

  • 数栈-数据科学平台 DTinsight.Science的客户价值是:
    帮助企业构建算法服务能力,让数据智能快速落地,构建数据智能化与业务智能化双向驱动引擎。

     

  • 数栈-数据科学平台 DTinsight.Science给谁用:
    企业的数据科学家和数据分析师们

2

再深入了解DTinsight.Science

2.1 研发初衷

 

随着大数据在企业中横向与纵向的深度应用,已经有离线计算、实时计算等大数据产品解决客户常用的计算与运维场景。目前,数据的智能化应用也是更多企业应用、探索的方向,让数据智能驱动业务智能。在这个过程中,怎么让更多的企业快速拥有数据智能化的能力,是数据科学平台思考的方向。

 

所以今天,数栈推出数据科学平台来构建数据加工后的算法建模能力,为数据科学家数据分析师提供完善易用的开发平台,希望为企业提供更加科学、准确的判断,实现数据的高价值应用。

2.2 产品优势

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

#兼容主流机器学习与深度学习框架#

 

TensorFlowMXNetPythonSpark

 

数栈-数据科学平台DTinsight.Science目前支持TensorFlow、MXNet、Python、Spark计算框架,不同的算法任务可选择合适的计算框架,支持多维化开发场景。后续也将支持Pytorch、XGboost等计算框架。

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

 

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

#丰富的算法组件库#

你需要的组件,我都会有

 

数栈-数据科学平台DTinsight.Science封装了多类算法组件,包含数据源/目标、SQL脚本工具、数据预处理、特征工程、统计分析、机器学习、深度学习、预测、评估、文本分析、网络分析等算法组件,充分覆盖算法建模场景。

 

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

DTinsight.Science具有丰富的算法组件

 

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

#可视化实验建模#

可视化、拖拉拽方式进行算法建模

在大数据深度应用的现在,越来越多的人员对数据与业务的智能结合,算法模型搭建充满兴趣。数栈-数据科学平台DTinsight.Science支持可视化实验建模,可将算法组件拖拉拽至画布区域,组成可视化的实验流,可界面化配置组件参数,并可视化查看数据运行结果以及模型结果,简单易上手。

 

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

DTinsight.Science支持可视化实验建模

 

 

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

#交互式Notebook数据探索#

使用Python自由进行数据探索

除可视化的实验搭建外,数据科学平台同时具备交互式Notebook开发环境,可进行python代码的编写,执行某段语句查看相应结果与运行日志,为数据分析师提供自由的数据探索环境。

 

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

交互式Notebook自由进行数据探索

 

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

#模型离线训练#

 

周期调度,训练模型参数

 

算法模型开发完成后,可提交任务进行离线调度,调度引擎根据调度周期进行模型训练,产生新的模型参数与数据。模型训练完成后,可查看评估结果,选取合适的模型参数进行保存应用,或在线部署。

 

 

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

#模型在线部署#

 

模型在线部署和调用,实时挖掘数据价值

 


当模型的预测及评估结果达到目标后,可进行模型在线部署,将模型部署至模型服务器上,并生成模型的调用API。部署后,可进行模型的在线调用。

 

除以上核心功能外,基础的租户隔离、项目创建管理、用户管理、角色管理、数据接入等也是具备的,可一站式完成机器学习作业,欢迎大家体验。

 

3

使用DTinsight.Science可以

做哪些有意思和有价值的事情?

 

数栈-数据科学平台 DTinsight.Science可帮助企业构建算法服务能力,服务于企业数据的多样化应用场景,驱动业务创新发展。常用的应用场景如下:

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

基于相关数据进行个性化的商品推荐、视频推荐、旅游商品推荐、广告精准投放等。

精准营销

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

分析用户关系网络,进行人群关联,精细化任务画像,扩大营销范围及场景。

关系网络

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

分析销售与库存关系,帮助企业智能化进货、退货,合理使用库存控件,并保证健康的供应链关系。

库存优化

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

利用整体的销售数据,以及单品历史销售数据,可进行单品未来的销售预测,合理的指导门店销售及铺货。

销售预测

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

金融领域是算法模型应用比较成熟的领域,应用的场景也很多,比如根据个人信用评估,进行贷款发放的预测,贷款还款的预测,进行风险控制,以及屏蔽羊毛党等营销场景上的使用。

金融风控

数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

在不同的行业领域,会有更多的分析场景,如文本分析、图片分类、视频分析等。

其他

截止到今天,袋鼠云企业级一站式数据中台PaaS-数栈具有数据计算引擎、数据开发平台、数据科学平台、数据资产平台、数据服务引擎等5大产品模块,平台覆盖全链路的数据采集、数据分析、数据挖掘、任务运维、数据质量、数据地图、数据模型、数据API开放等场景,充分满足企业建设数据中台过程中的多样复杂需求。

 

目前,西湖风景名胜区、西溪湿地、山西商务厅、老板电器、中金易云、河南世纪联华、浙江大学、常州旅游商贸职业技术学校、宁波图书馆、京东方、福建票付通、观远数据、东方龙马、佰羚数据等客户和合作伙伴都已经在使用或者参与数栈产品共创。

数栈

企业级—站式数据中台PaaS

 

数据计算引擎

提升企业数据共享能力,加速释放数据价值

  • 离线计算引擎

    基于Apache Spark,计算速度比MapReduce快百倍

  • 实时计算引擎

    基于Apache Flink,高吞吐、低延迟、高性能

数据开发平台

一站式大数据开发平台,快速完全数据中台搭建

数据科学平台

机器学习作业探索平台

 

  • 可视化实验搭建,集成多种主流计算框架与丰富的算法组件
  • 交互式Notebook开发,提供自由的算法探索环境
  • 模型离线训练,支持周期调度与任务管理
  • 模型在线部署,支持在线调用模型与更新模型版本

 

数据资产平台

构建企业数据资产中心,实现数据管理规范化

  • 数据地图

    可视化数据资产中心,数据全生命周期可知可管

  • 数据质量

    覆盖90%质量校验场景,双表逐行校验保障海量数据一致

  • 数据模型

    构建OneData数据模型,快速上手清晰易懂的数据规范

 

 

数据服务引擎

提升企业数据共享能力,加速释放数据价值

  • 数据可视化

    让数据价值看得见,打造新一代“四有”大屏

  • 分析引擎

    百亿数据实现秒级查询多维度,频度复杂分析

  • 数据API

    “0代码”API生成,多权限控制保障数据开放安全