基于分析云里根SAP的业务数据绘制Word云

“词云”这个概念是由美国的一位新闻学副教授根据互联网上搜索到的信息首次提出的。它突出了文本中出现频率较高的关键词,一般采用“出现频率越高,关键词呈现尺寸越大”的规则。由这些不同大小的关键词组成的云状彩色图形,一旦浏览图形,就能帮助观众欣赏到词云背后文字的主旨。

例如,周杰伦的词云《双截棍》的歌词如下:

基于分析云里根SAP的业务数据绘制Word云

其中,使用频率最高的单词突出显示如下:

基于分析云里根SAP的业务数据绘制Word云

除了在互联网的前端被广泛使用,词云还可以在SAP中发挥其优势。例如,Jerry在文章“面向客户的SAP分析云和SAP云的集成”中提到,最近我们做了一个项目,通过微信收集用户和SAP对话人工智能之间的聊天记录,然后使用词云在这些聊天记录中显示关键词。

起初,Jerry在Github中发现了一些生成词云的开源工具,包括JavaScript和Python实现:

https://www.npmjs.com/package/tag-cloud

https://github.com/amueller/word_cloud

后来了解到,SAP分析云本身支持使用R的开发包wordclound来生成词云:

https://www.sapanalytics.cloud/resources-r-packages/

基于分析云里根SAP的业务数据绘制Word云

所以我想尝试用SAP分析云来实现它。

要在SAP分析云上使用wordcloud开发包,您需要通过配置将其连接到可用的r运行环境。r语言是一种编程语言,在统计分析和各种图表显示领域具有独特的优势。

在系统配置中,您可以选择使用由SAP分析云集成的运行环境,或者远程连接到部署在第三方的运行环境。

基于分析云里根SAP的业务数据绘制Word云

绘制词云的数据来源是由以下csv文件提供的:某一地区每个超市每月不同产品的销售量。我设定的词云绘画规则相对简单。销售量(字段数量)越大,在词云出现的产品名称就越大

基于分析云里根SAP的业务数据绘制Word云

上述电子表格文件可从思爱普官方网站下载:

https://www . sap analytics . cloud/WP-content/uploads/2018/02/BestRun . xlsx

我大大简化了它。上传到思爱普分析云后,我基于该文件创建了一个名为BestRunJerry的新模型,并将“数量”列设置为“测量”。

基于分析云里根SAP的业务数据绘制Word云

将产品描述设置为产品名称,以便稍后用r绘制的词云将显示可读性更好的产品名称,而不是产品标识。

基于分析云里根SAP的业务数据绘制Word云

基于构建的模型创建一个新的故事,并插入一个新的可视化,一个负责显示渲染的词云:的用户界面控件

基于分析云里根SAP的业务数据绘制Word云

将产品设置为行的成员:

基于分析云里根SAP的业务数据绘制Word云

数量实体被设置为列的一个成员,因此在下面的r编辑器中,存储在模型中的相应数据可以通过访问两个变量“产品”和“数量实体”来获得。

基于分析云里根SAP的业务数据绘制Word云

现在开始添加r脚本

基于分析云里根SAP的业务数据绘制Word云

完成了四行脚本

基于分析云里根SAP的业务数据绘制Word云

单击执行查看执行效果:

基于分析云里根SAP的业务数据绘制Word云

结果渲染:

基于分析云里根SAP的业务数据绘制Word云

4行r脚本的含义:

(1)库(字云):加载SAP分析云的r开发包字云;

(2)单词-bestrongjerry $ Product:读取bestrongjerry型号的产品数据,并将其存储在可变单词中;

(3)Frequency-bestrongjerry $ Quantity old:使用“已售出产品数量”字段的值来模拟关键字出现的频率,并将其存储在可变频率中;

(4)单词云(单词、频率、比例=c(3,1),rot.per=0.2,colors=brewer.pal(8,'Dark2 '))

调用wordcloud开发包来生成词云。输入参数的含义是指开发包的文档:

https://cran . r-project . org/web/packages/word cloud/word cloud . pdf

基于分析云里根SAP的业务数据绘制Word云

每当我们点击SAP分析云的R编辑器器里点中的执行按钮时,我们可以在Chrome开发工具中观察到编辑器已经向R运行时环境发送了一个HTTP请求,其中包括当前正在编辑的R脚本的长度和宽度以及之前插入的R可视化控件。

基于分析云里根SAP的业务数据绘制Word云

根据这些输入,SAP分析云的R运行环境执行服务器端词云渲染,然后将渲染的词云内容以png图片文件的base64格式返回给浏览器:

基于分析云里根SAP的业务数据绘制Word云

基于分析云里根SAP的业务数据绘制Word云

接下来,杰里将研究如何从文本格式的聊天记录中提取关键词,并以词云的方式显示在思爱普分析云中。这也是我当前项目的要求。请期待它。

基于分析云里根SAP的业务数据绘制Word云

本文来自云栖社区合作伙伴“汪子熙”。如果你知道相关信息,你可以关注微信公众号‘汪子熙'.’