博客 大模型应用落地,Data+AI生产力一触即发丨2025袋鼠云春季发布会回顾

大模型应用落地,Data+AI生产力一触即发丨2025袋鼠云春季发布会回顾

   数栈君   发表于 8 小时前  6  0
4月16日,袋鼠云成功举办了以“做 Data+AI 的长期主义者”为主题的2025年春季发布会。大会深度探讨了如何凭借 AI 实现新的飞跃,重塑企业的经营管理方式,加速数智化进程。
当下,大模型已然成为推动科技变革的核心力量。作为大会的重要环节之一,袋鼠云AI产品专家林树,为大家带来主题为《大模型应用落地,Data+AI生产力一触即发》的精彩内容,详细介绍了袋鼠云在大模型应用方面的强大能力及相关应用场景,向我们展示如何通过Data+AI 的深度融合释放出强大的生产力。
以下为大会视频回放以及演讲实录:
➡️下载演讲资料:

制造业:AI客服项目

痛点与建设目标

以制造业AI客服项目为例,制造行业售前咨询存在以下痛点:
  • 高频问题人力依赖:高达70%的咨询集中在规格、型号、价格等标准化问题上,但仍需人工逐条回复,效率极低。
  • 知识传递断层:客服人员熟悉产品需要大量时间,还依赖工程师支持,导致响应速度慢,服务标准不统一。
  • 售后流程低效:手动填写工单耗时费力且错误率高,工单不规范引发反复沟通,影响客户体验。

 AI应用案例与RAG技术

为了使大模型的回答更加精准,RAG技术与大模型能力的结合至关重要。RAG可以分为两个阶段,数据准备阶段和问题回答阶段。简单来说,RAG就是带着资料回答问题,能够有效提升大模型回答的准确性。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/afc4c14e37ab417688ddd868373af7c6..jpg

项目挑战与应对

从对AI应用案例及RAG技术的分析中,可以看出数据质量是AI客服项目面临的最大挑战。制造业文档通常十分复杂,主要存在以下四类问题:
  • PDF文档的复杂性:制造业的PDF文档往往包含文字、图片和表格。这些内容形式多样,提取起来并不容易。
  • 表格处理的难点:表格本身就很复杂,比如合并单元格、跨页表格,甚至表格中嵌套图片。这些问题会导致数据提取不完整或结构混乱,直接影响后续的使用。
  • 文档切片与信息丢失:在将文档切片时,表头信息很容易丢失。比如一份长表格被切分成多个片段后,后续片段可能没有表头。
  • 召回准确度:最后是召回准确度的问题。即使数据提取出来了,很可能检索时也无法准确匹配用户问题。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/d259d78da9372477f6e8851d36bc27ca..jpg

针对这些问题,袋鼠云采取了一系列应对措施。
  • 文档解析方面:使用PDF版面OCR识别和表格识别技术,优化了Docling模型,确保复杂文档中的文字和表格能够被准确提取。
  • 对于文档切片:采用父子分片策略(将长文档按层级切分),将长文档切分成小片段,同时保留表头信息,确保数据完整性和可读性。
  • 在召回精准度上:引入结果重排序(Rerank),【topk8,top0.3,温度0.1 千问-Qwen32b】和召回重写机制,提升检索的准确性。
  • 在Prompt提示词工程方面:开发了内部版本对比Prompt工具,对FAQ、引导语和聊天记录进行向量化处理,优化Prompt设计。


图书馆:AI知识库项目

痛点与建设目标

AI图书馆也非常火热,图书馆天然有丰富的数据资源,同时图书馆业务也不简单,背后业务系统一看有二十多套。
通常图书馆中会存在以下痛点:
  • 业务系统对接困难:图书馆背后业务系统多达二十多套,且这些系统多为老旧系统,智能体工作流无法直接调用接口。这导致在项目实施过程中,需要投入大量精力进行业务流程梳理和系统调研。
  • 数据量巨大且持续增长:图书馆图书存量接近千万,并且每月新增近万本,庞大的图书数量以及持续的增量给数据处理和存储带来了巨大压力。
  • 数据处理复杂:图书的排版布局样式丰富,这使得对图书数据的处理和存储变得更加复杂,增加了项目实施的难度。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/cd1d08390983eec0a60ca61d442a0311..jpg


项目解决方案

聚焦关键场景方面,袋鼠云与图书馆客户进行了反复沟通,明确了关键场景和1.0里程碑。我们重点关注以下几个方面:
  • 面向师生的AI馆员:提供智能咨询服务,帮助师生快速找到所需信息。
  • 图书馆FAQ:搭建常见问题解答系统,减少人工咨询量。
  • 空间预定和图书借阅:优化核心业务流程,通过直接对话框完成预定和借阅操作。
图书馆知识库建设上,在知识库建设方面,袋鼠云采取了以下措施:
  • 图书检索:通过AI技术将文本描述转化为正则表达式,实现精准检索。
  • 全量图书向量化:提取元信息,构建知识图谱,确保数据的结构化和语义化。
  • 增量图书自动化:通过轮询API接口和CDC技术监控变更日志,实现数据的自动更新。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/3f7389a5c7944648de3c2b3809165228..jpg


AI应用开发平台发布

介绍完2个AI应用项目的经验后,林树带来了经过过去1年的实践和经验积攒,袋鼠云内部孵化了一款AI应用开发平台。

产品架构

AIWorks是一款企业级AI应用开发平台,专注于为企业提供安全可控、灵活扩展的A1应用开发能力。平台以私有化部署为核心,企业可基于平台可视化开发、多模型支持及工作流编排等能力,助力企业快速构建AI智能应用,实现AI能力与业务场景的高效融合。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/f23d2c5d9dd2769423ac6d2a6b46600c..jpg


关键页面

对话页面

在对话页面,支持将开发好的机器人进行聊天测试,并发布成到钉钉/微信/飞书工作台用户也可以随时切换底层模型。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/7eefa5e0ca145f20c87029c9902924a5..jpg

智能开发模块页面

支持智能体流程节点编排与调试,提供API调用与Iframe嵌入方式与第三方系统集成。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/ebca11920951b18493302b06a0a82f35..jpg

知识库管理页面

在知识库管理中,支持可视化文档处理和召回命中测试,支持多种开源嵌入模型和重排模型等。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/e15a5e72225a46d1a978b3536ac1f54e..jpg

AI硬件产品与服务系列

同时,袋鼠云也提供硬件产品和相关服务。帮助用户快速搭建部署AI大模型,赋能企业业务。

DeepSeek一体机

袋鼠云主要提供两套方案:DeepSeek通用一体机、DeepSeek智能应用一体机。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/1512e4ce61e1e4964bbada058ed42059..jpg

模型微调服务

同时我们也提供协助或替代客户完成模型微调、模型训练服务。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/60e3a1258c48635c02a588d527029125..jpg
欢迎带着您的业务场景和目标,我们一起来交流探讨。如果你对我们的产品感兴趣,欢迎点击“阅读原文”申请产品试用。
http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/7ba98aa21d81498403955bd12bf91e14..png

  申请试用&下载资料
点击袋鼠云官网申请免费试用:https://www.dtstack.com/?src=bbs
点击袋鼠云资料中心免费下载干货资料:https://www.dtstack.com/resources/?src=bbs
《数据资产管理白皮书》下载地址:https://www.dtstack.com/resources/1073/?src=bbs
《行业指标体系白皮书》下载地址:https://www.dtstack.com/resources/1057/?src=bbs
《数据治理行业实践白皮书》下载地址:https://www.dtstack.com/resources/1001/?src=bbs
《数栈V6.0产品白皮书》下载地址:https://www.dtstack.com/resources/1004/?src=bbs
0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群