如何使用 KNIME 生成报告
1.背景
KNIME的报表设计基于BIRT(Bussiness Intelligence Reporting Tool),这两种工具在同一个平台内可以共同协作,对于每个工作流,可以通过生成报告按钮直接进入report界面进行报表设计。
在KNIME中,我们建立workflow进行数据操作,生成数据和结果,而BIRT可以用这些内容生成报表。每次在workflow中修改后,BIRT会进行自动更新。
通常报表只需要对数据分析中的一部分结论进行展示,KNIME 的Report功能的好处在于,可以分别将这些信息接入BIRT,并进行报表设计。
2.从Workflow到Report
一个workflow只能与一个报表相连接,我们可以通过workflow界面上的“Report”icon进入BIRT环境,此时我们打开的是与当前所在workflow相连接的report。
本篇的report采用如图所示的workflow,将分析得出的统计图和统计表展示在报表中。
2.1 Report designer拓展模块的安装
上次介绍了KNIME的几大基础模块,然而在基础模块中不包含报表工具。上篇也提到了KNIME有Extension功能,而Report designer的功能即可通过这个功能进行下载安装。具体的方法是“File”→“Install KNIME extention”,搜索Report designer并且进行安装。
安装完成后,在Node Repository栏目中就会多一个模块——Reporting,下面包含两个节点,分别是Data to Report和Image to Report。二者的区别会在下文中提到。
2.2 KNIME 中的BIRT环境
搭建完workflow后,点击图中所示'Report' icon,就会打开新的Report编辑页面。
在这个界面中可以完成报表的结构设计,添加或修改文字、图片、表格等多种内容。界面共分为以下几个部分——KNIME Workflows,Data Set View,Report Items,Report Editor,Layout/Master Page。其中在workflow中添加了Reporting节点的数据集会出现在Data Set View,也就是报表中的数据来源;Report Items中是组成报表的元素类型;Report Editor是报表排版操作界面,在这里可以看到报表视图大纲(不是真实报表);Layout/Master Page中可以进行Report,Grid,Item等不同级别的报表内容设置。
3.数据准备
3.1 Report中的数据来源
在report中呈现的内容可以有两种来源,一种是workflow中已经生成的image,不需要再进行修改可以直接用于report;另一种是workflow中已经进行过数据处理,想要呈现在报表中的是需要再加工的图形或表格(再加工是指对图表进行双轴、聚合等设置,或者在表格中进行指标计算等)。
以上两种情况分别对应于Reporting模块中的两个节点,使用Data to Report,传入的数据可以作为数据集提供给KNIME Report Designer,在BIRT环境中进行再加工;使用Image to Report节点,则传入的图像可以作为数据集提供给KNIME Report Designer。
3.2 报表生成常用到的数据处理节点
数据总是要以预定义的数据表结构到达报表,无论最终呈现方式是什么,都需要先明确报告中所需要的图表的数据结构,再去做相应的数据处理。在本次报表生成中用到的两个主要节点是Groupby和Pivoting。
下图中是需要进行处理的数据表。
下图中是通过Groupby节点得到的数据结构。在图表1和图表2中会用到brand,date,amount三个维度。
下图中是经过Pivoting节点生成的数据透视表,在图表3和图表4中会用到model,brand以及各月份的销量数据。
此外还可以结合Joiner,Math formula等节点,共同进行更复杂的数据处理。
4. 报表设计
4.1基本设置
报表的基本设计,例如页面大小、边框、标题、页脚等等都在界面最下方的Layout/Masterpage部分完成,当想要设置不同的组件,只需要用鼠标点选相应的部分,下方Properties将切换成对应于将要设置的对象。例如上图中,标题部分被点选后外框显示高亮,则下面的Property自动切换成对应label进行设置。
4.2页面布局设置
KNIME中页面布局设置可以通过Grid完成,从Report Items中将Grid组件拖拽进Report Editor,可以通过设置行列的数量,决定将Report页面划分成几部分,再在格网的每个格子里分别插入标题、图片、表格、文本等内容。插入网格后,可以对相邻网格进行合并,以适应多样的布局需求。
4.3使用数据表在Report中生成图表
使用workflow中生成的数据表在Report中生成图形的流程如下:
Select the chart type;
Select the data;
Format the chart.
我们在Report Item中选择Chart,拖入Report Editor中进行编辑,双击图片即可进入编辑设置界面。如图所示为选择图表类型和选择制图所需数据的过程。其中在Multiple Y Axis中可以设置双轴。
全部设置完毕后在Format Chart中设置图表格式,即可在report中生成图片。但是这里值得注意的是在KNIME的视图中展示的只是排版概况,要想看到真实Report的效果需要预览。
4.4使用workflow中的图表直接插入Report
要想在报表中插入之前workflow中生成的各类统计图需要提前有些小的设置。首先在report视图下,保证Report Editor中没有任何内容被点选。然后点击Script选项卡,在下拉菜单中选择beforeRender,并输入如图命令“KNIME.enableSVGImagesInPDF(reportContext)”,
然后回到Layout选项卡下,插入适用于报表的图片,并在图片高亮的情况下进入Advanced选项卡,在Type expression一栏中输入"image/svg+xml".
至此插入图片的设置完成,这种方法适用于报表中使用的是workflow中生成的图。
4.5 表格插入
通过拖拽Data Set View中的数据集到Editor中相应位置,就会出现弹窗要求选择要展示的数据字段,选择完成后数据集就以表格形式出现在报表大纲视图中,除了字段之外,表格的数据部分在大纲视图中会被缩略,方便使用者进行排版和设置。视图内很容易进行表格编辑操作,包括表格增加删除行列、边框、尺寸大小、字段名称修改等。
4.6 报表导出和预览
报表的预览图标在最上面一排的播放键,右面的小三角可以带出下拉菜单选择预览方式,支持的预览方式包括Web,DOCX,HTML,PDF等多种形式。
在预览界面可以将报表导出,导出格式也很多样,如图所示。
总结:KNIME的报表功能总体上功能很强大,可以进行丰富的版式设计,也可以根据已有数据集完全重新生成图表(本篇使用的是workflow中生成的图片),但是上手稍慢,一些前期设置操作略显复杂。生成的Report中可以任意添加描述、图片、进行任何形式的排版,在完整性上很出色。此外报表的导出多集中于文档形式,无法生成外部链接。关于这部分的实现需要KNIME Server的协助。
推荐阅读
-
35 岁实现财务*,腾讯程序员手握2300万提前退休?-1000万房产、1000万腾讯股票、加上300万的现金,一共2300万的财产。有网友算了一笔账,假设1000万的房产用于自住,剩下1300万资产按照平均税后20-50万不等进行计算,大约花上26-60年左右的时间才能赚到这笔钱。也就是说,普通人可能奋斗一辈子,才能赚到这笔钱。在很多人还在为中年危机而惶惶不可终日的时候,有的人的35岁,就已经安全着陆,试问哪个打工人不羡慕?但问题是有这样财富积累必然有像样的实力做靠山。没有人可以不劳而获。 看到这里,肯定有人说,那么对于普通人来说,卷可能真就成了唯一的出路。但是卷也有轻松的卷,“偷懒”的卷法,对于程序员而言,刨除掉一时无法改掉的开会传统占用的大部分时间,如何把有限的时间和精力放在真正重要的架构设计、需求设计上,而不是重复的造*,编码、改bug、手动测试。因此在科技改变生活的今天,学会使用AI工具成为程序员们的必备技能。 以全栈式全自动的软件开发工具飞算SoFlu软件机器人为例,作为全球首款面向微服务架构设计和最佳实践的软件机器人,SoFlu软件机器人改变了原来手工编码的作业模式,通过可视化拖拽方式以及参数配置就能实现等同于编写复杂代码的业务逻辑,在设计业务逻辑时就完成了微服务应用开发,做到“业务即图,图即代码”,实现“软件开发,十倍提效”。 而作为飞算SoFlu软件机器人的一个重要组成部分,FuncGPT(慧函数)支持所有类型函数创建。通过自然语言描述Java函数需求,实时生成高质量、高可读性的Java函数代码。生成代码可直接复制到IDEA,或一键导入Java全自动开发工具函数库。 FuncGPT(慧函数)具有五大核心能力: ● 自然语言:通过自然语言即可生成函数,降低软件开发门槛。 ● 秒级函数开发:全自动秒级开发函数,秒级完成,效率千倍提升。 ● 一站式函数开发应用:函数生成即可直接应用,效率、安全有保障。 ● 质量可靠:生成的函数代码符合业界规范、具备良好的可读性,符合最优解。 ● 灵活生成:可以根据开发人员的具体需求生成并支持调整和修改。 以“将文件流转换为File对象”这个需求为例,以下是FuncGPT(慧函数)秒级生成的代码: / 类名:FileConverter // 函数名:convertStreamToFile // 函数功能:将文件流转换为File对象 // POM依赖包:无 import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; public class FileConverter { /** * 将文件流转换为File对象 * @param inputStream 文件流 * @param filePath 文件路径 * @param fileName 文件名 * @return 转换后的File对象 * @throws IOException 如果发生I/O异常 */ public static File convertStreamToFile(InputStream inputStream, String filePath, String fileName) throws IOException { File file = new File(filePath + File.separator + fileName); // 创建File对象 try (FileOutputStream outputStream = new FileOutputStream(file)) { // 创建文件输出流 byte buffer = new byte[1024]; int bytesRead; while ((bytesRead = inputStream.read(buffer)) != -1) { // 从文件流读取数据并写入文件 outputStream.write(buffer, 0, bytesRead); } } return file; // 返回转换后的File对象 } } // 函数示例 // 将文件流转换为File对象示例 // 入参:inputStream,文件流 // 入参:filePath,文件路径 // 入参:fileName,文件名 // 出参:file,转换后的File对象 // 调用示例: // InputStream inputStream = new FileInputStream("example.txt"); // String filePath = "C:\\Users\\User\\Documents"; // String fileName = "example.txt"; // File file = FileConverter.convertStreamToFile(inputStream, filePath, fileName); // System.out.println(file.getAbsolutePath); // 输出结果:例如,将文件流转换为File对象后,文件的绝对路径为:C:\Users\User\Documents\example.txt // 则输出结果为:C:\Users\User\Documents\example.txt 通过分析,不难发现以上代码:
-
问:如何使用查询生成器获取 GreenDAO 中列的最大值?
-
Android 教程系列 第 27 部分]如何使用 Keytool 工具生成密钥存储签名文件
-
使用 PHPUnit 进行单元测试和生成代码覆盖率报告的方法
-
使用 Python 中的 unittestreport 生成 HTML 报告、重新运行失败案例、通过电子邮件发送测试报告,并将结果推送到钉钉和微信。
-
如何在 Python 中使用迭代器和生成器
-
如何在 Android 中使用 go 生成的 so 文件
-
如何使用 Go 语言中的模板功能实现 Word 文档的动态生成?
-
如何使用 KNIME 生成报告
-
使用 BIRT API 生成报告 rptdesign 文件