随着对BI应用程度的加深,用户需要连接和管理的数据越来越多,也越来越复杂。smartbi支持丰富的数据源接入,但一般并不能直接使用接入的业务库直接进行数据分析。所以在报表开发前的取数过程,把需要的数据整合成一个数据集合,可以理解为我们基于数据库获取我们需要的数据,也是数据分析师和最终业务用户进行交互分析前的准备步骤。
Smartbi为用户提供了强大而灵活的数据获取能力,一方面继承了需要掌握sql和存储过程等倾向于技术人员的传统数据集,如有:SQL数据集、原生SQL数据集、Java数据集、存储过程数据集、多维数据集。另外也具备可视化界面让业务人员也能实现数据准备,如:自助数据集、透视分析数据集、即席查询数据集、可视化查询数据集。
无论是技术人员还是业务人员都可以通过相应的查询从数据库获取到所需的数据来进行数据分析。对各种数据集推荐使用的场景与人群做了简单的划分,如下图:
数据集类型 | 使用场景 | 使用人群 |
Sql数据集 | 各种分析报表 | 熟悉sql技术人员 |
原生Sql数据集 | 各种分析报表 | 熟悉sql技术人员 |
存储过程数据集 | 存储过程有结果集返回,用于各种报表 | 熟悉存储过程的技术人员 |
多维数据集 | 展现多维数据源的数据,用于各种报表 | 技术人员 |
Java数据集 | 配置Java数据源后使用,用于各种报表 | 熟悉Java类的开发人员 |
自助数据集 | 制作自助仪表盘 | 业务人员 |
透视分析数据集 | 制作Excel分析(推荐)/电子表格 | 业务人员 |
即席查询数据集 | 制作Excel分析 | 业务人员 |
可视化查询数据集 | 各种分析报表 | 不熟悉sql的业务人员 |
对于熟悉SQL语句的技术人员来说,可以使用SQL数据集、原生sql数据集来通过在文本输入区中直接输入各类数据库方言表达式定义数据集条件和内容。那sql数据集与原生sql数据集如何选择呢?SQL数据集是一类封装结构的原生SQL数据集语句,在解析SQL语句过程中对最外层进行了包装,而原生SQL数据集没有对最外层进行包装,是按照“所见即所得”的方式进行解析并执行。
对于熟悉存储过程技术人员可以选择存储过程数据集。是针对存储过程定义数据集条件和内容的一类数据集。另外,如果需要基于多维数据源创建数据集,系统也是支持通过创建多维数据集将多维数据库中的cube进行转换,形成可以供报表使用的数据模型,整个操作都是可视化的,方便灵活。能快速地在电子表格、仪表分析等报表上展现多维数据源的数据。同时我们也给熟悉Java类的开发人员准备Java数据集。此数据集具体是指将Java查询对象输出的数据转换成集合,支持自行编写java类处理数据、调用webservice接口返回数据,内置了txt、csv文件读取等数据获取方式。
Smartbi改变了传统的方式,使业务用户通过简单的拖放即可实现对各类查询的操作从而获取各种分析数据集。比如有大屏展示需求的业务人员可选择Smartbi提供的自助数据集来制作自助仪表盘就最适合不过了。自助数据集是一类基于个性化需求并剧本灵活查询能力的数据集,用户可以根据业务要求,通过可视化的方式,使用跨数据库、多表关联、数据转换、复杂逻辑关系计算、数据抽取ETL等功能,将数据提取到自助数据集。
可视化查询数据集专门给不熟悉SQL语句的业务人员自行从数据库里获取所需要的查询条件和数据。基于数据源或是业务主题通过简单拖拽操作创建所见即所得数据集。
业务人员使用Excel分析可采用透视分析、即席查询数据集作为数据库取数的来源。其中可视化查询类似Excel数据透视表,作为数据集能够实现对数据的查询与探索。另外透视分析还可作为电子表格的数据来源。即席查询数据集则是用于大量明细数据的查询的清单式数据集。
以往数据准备基本都依附于技术人员,目前在一定程度上不仅让技术人员从繁琐的工作中解脱出来,也能使业务人员也能参与到数据处理环节中。真正做到人尽其才。
数据查询能力亮点
Smartbi提供强大的界面化数据管理能力,由用户自行在源数据关系的基础上构建自己的业务所需数据集。 如可视化查询就能让用户在一个可视化界面拖拉拽即可轻松完成数据模型的构建,使我们的分析用户更快、更直观地获取到准备好的数据,从而更快、更智能地进行业务决策。
自助数据集支持跨库查询,当用户查询数据的范围比较广并不限于一个数据库时,可以跨多个库进行查询。提供跨数据库查询功能,支持将不同的数据源关联,应对不同接口数据统一访问问题。
3.高速缓存机制
系统支持数据抽取功能的数据集:自助数据集、可视化数据集、SQL数据集、存储过程数据集、Java数据集、即席查询、透视分析。大部分数据集都支持通过数据抽取从源数据库中抽取原始数据到高速缓存库,它可以保证秒级获取大级别量的数据结果,提高系统性能。