当前位置:CIO技术探讨 → 正文

Tableau使用了新的自然语言工具来解释您的数据

责任编辑:cres 作者:Peter Sayer |来源:企业网D1Net  2019-11-02 11:49:42 原创文章 企业网D1Net

Tableau最新的自助服务功能,Explain Data,能够以用户易于理解的方式为其数据可视化提供自动分析。
 
长期以来,自助服务分析工具赋予了用户拥有能够在不需要IT干预的情况下生成数据可视化的能力。数据准备自动化等最新进展进一步降低了其进入门槛,但是,这种推动分析民主化的努力肯定也有其局限性。毕竟,用户仍然需要解释他们生成的数据可视化。
 
Tableau发布的2019.3版本的软件更新旨在通过一个名为Explain Data的新功能来解决这个问题,该功能旨在讲述图表背后的故事,为那些没有统计专业知识的人提供清晰的语言分析。
 
在某种程度上,ExplainData是Ask Data的对应功能,该功能包含在了二月发布的2019.1版本当中。Ask Data使Tableau用户能够在聊天窗口中描述他们想要看到的可视化效果。然后,它能够接受这种自然语言输入,使用它来构建可视化,并允许用户以交互的方式细化图表或在更多数据上进行分层。
 
有了这个新功能,用户可以点击可视化内容中的一个数据元素--比如散点图中的一个点,或者是时间序列图中的一条线--然后点击“Explain Data图标。新出现的一个对话框,将提供一个或多个解释,并说明该元素与其他元素的不同或偏离趋势的原因。Tableau通过测试数百种模式和潜在的解释做到了这一点,并且只给出了最具统计意义的解释。
 
Tableau的首席产品官Francois Ajenstat展示了波士顿自行车共享服务的使用情况。对骑自行车来说,二月是一个淡季--波士顿很冷--但不止如此,正如Explain Data所显示的那样:在二月,剑桥附近骑自行车的人反而多得不成比例。不管天气如何,学生们似乎都会骑自行车。有了这样的洞察力,自行车共享公司就可以保护大部分自行车免受雪和盐的侵害了,而剩下的自行车也最有可能在冬天被使用。
 
Explain Data还可以识别散点图中异常值背后的原因--在Ajenstat的演示中,揭示了单月车程是导致一个租赁站平均车程异常高的原因所在。
 
你的业务可能并不是自行车租赁,但类似的解释可能有助于缺乏统计知识的员工识别最有利可图的销售区域或发现欺诈和数据输入的错误。
 
“我们在测试周期中得到的反馈是,这真的很有帮助,因为它有助于揭示数据中隐藏的模式,否则人们将无法看到这些模式,”Ajenstat说。
 
超前的需求
 
这项功能是否有真正的需求还有待观察。在451 Research最近的一项调查中,只有六分之一的受访者表示他们的组织对这种自然语言生成的分析功能感兴趣,在几乎所有战略决策都由数据驱动的组织中,这一比例上升到了三分之一。
 
451 research负责数据、人工智能和分析的研究副总裁MattAslett表示:“像ExplainData这样的自然语言解释工具当然不是噱头,但Tableau和其他引入自然语言功能的供应商似乎已经领先于了主流企业的需求。”
 
Aslett说,随着技术的成熟,它可以通过让复杂的查询结果更容易理解来提高数据的可读性--但在早期,经验丰富的分析用户才最有可能从中受益,帮助他们在已经知道如何做的分析上节省时间。
 
Ajenstat无意中强调了在不了解真实世界的情况下使用自助、自动化工具的一个危险之处,尽管他同时也展示了一个名为Describe Forecast的较老功能,该功能提供了有关Tableau如何推断时间序列中的下一个元素的技术数据。当他打电话预测下一个冬天自行车租赁的使用量时,模型预测骑自行车的次数可能为负数--这是不可能的,但是对于软件来说,在人类设定这个领域可以接受的数值之前,这只是另一个数字而已。
 
“这是一些自动模型面临的挑战之一,”他说。“从算法的角度来看,就是如何调整引擎来处理任意数据集,而不必自定义所有的数据集?”
 
Explain Data对于升级到Tableau2019.3的企业是免费的。其他改进包括在门户或内部网页中嵌入了早期的AskData功能以鼓励更多的使用,以及在静止时加密所有提取数据的能力。
 
目录和服务器管理组件
 
Tableau 也为后台发布了新软件。Tableau Catalog是数据管理附加组件的新成员,它使分析师能够识别谁在使用哪些数据源,以及哪些报表依赖于哪些字段。这将有助于确定更改对收集数据的影响。
 
还有一个新的服务器管理附加组件,它能够监控大规模部署中的硬件资源使用情况和查询性能。它还可以帮助在项目或服务器环境之间进行内容迁移。对于在Amazon Web Services上运行Tableau的企业来说,有一个新的选项可以用于在Amazon RDS PostgreSQL中外部托管Tableau的元数据存储库,Tableau说这可以提高其可伸缩性和可用性。
 
对于运行自己安装版本的企业,Tableau服务器管理附加组件每个用户每月的成本为3美元;该公司表示,其产品Tableau Online是Tableau的SaaS版本,它的用户已经从这项服务中获得了性能管理和扩展优势。
 
版权声明:本文为企业网D1Net编译,转载需注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。

关键字:CIO自然语言工具

原创文章 企业网D1Net

x Tableau使用了新的自然语言工具来解释您的数据 扫一扫
分享本文到朋友圈
当前位置:CIO技术探讨 → 正文

Tableau使用了新的自然语言工具来解释您的数据

责任编辑:cres 作者:Peter Sayer |来源:企业网D1Net  2019-11-02 11:49:42 原创文章 企业网D1Net

Tableau最新的自助服务功能,Explain Data,能够以用户易于理解的方式为其数据可视化提供自动分析。
 
长期以来,自助服务分析工具赋予了用户拥有能够在不需要IT干预的情况下生成数据可视化的能力。数据准备自动化等最新进展进一步降低了其进入门槛,但是,这种推动分析民主化的努力肯定也有其局限性。毕竟,用户仍然需要解释他们生成的数据可视化。
 
Tableau发布的2019.3版本的软件更新旨在通过一个名为Explain Data的新功能来解决这个问题,该功能旨在讲述图表背后的故事,为那些没有统计专业知识的人提供清晰的语言分析。
 
在某种程度上,ExplainData是Ask Data的对应功能,该功能包含在了二月发布的2019.1版本当中。Ask Data使Tableau用户能够在聊天窗口中描述他们想要看到的可视化效果。然后,它能够接受这种自然语言输入,使用它来构建可视化,并允许用户以交互的方式细化图表或在更多数据上进行分层。
 
有了这个新功能,用户可以点击可视化内容中的一个数据元素--比如散点图中的一个点,或者是时间序列图中的一条线--然后点击“Explain Data图标。新出现的一个对话框,将提供一个或多个解释,并说明该元素与其他元素的不同或偏离趋势的原因。Tableau通过测试数百种模式和潜在的解释做到了这一点,并且只给出了最具统计意义的解释。
 
Tableau的首席产品官Francois Ajenstat展示了波士顿自行车共享服务的使用情况。对骑自行车来说,二月是一个淡季--波士顿很冷--但不止如此,正如Explain Data所显示的那样:在二月,剑桥附近骑自行车的人反而多得不成比例。不管天气如何,学生们似乎都会骑自行车。有了这样的洞察力,自行车共享公司就可以保护大部分自行车免受雪和盐的侵害了,而剩下的自行车也最有可能在冬天被使用。
 
Explain Data还可以识别散点图中异常值背后的原因--在Ajenstat的演示中,揭示了单月车程是导致一个租赁站平均车程异常高的原因所在。
 
你的业务可能并不是自行车租赁,但类似的解释可能有助于缺乏统计知识的员工识别最有利可图的销售区域或发现欺诈和数据输入的错误。
 
“我们在测试周期中得到的反馈是,这真的很有帮助,因为它有助于揭示数据中隐藏的模式,否则人们将无法看到这些模式,”Ajenstat说。
 
超前的需求
 
这项功能是否有真正的需求还有待观察。在451 Research最近的一项调查中,只有六分之一的受访者表示他们的组织对这种自然语言生成的分析功能感兴趣,在几乎所有战略决策都由数据驱动的组织中,这一比例上升到了三分之一。
 
451 research负责数据、人工智能和分析的研究副总裁MattAslett表示:“像ExplainData这样的自然语言解释工具当然不是噱头,但Tableau和其他引入自然语言功能的供应商似乎已经领先于了主流企业的需求。”
 
Aslett说,随着技术的成熟,它可以通过让复杂的查询结果更容易理解来提高数据的可读性--但在早期,经验丰富的分析用户才最有可能从中受益,帮助他们在已经知道如何做的分析上节省时间。
 
Ajenstat无意中强调了在不了解真实世界的情况下使用自助、自动化工具的一个危险之处,尽管他同时也展示了一个名为Describe Forecast的较老功能,该功能提供了有关Tableau如何推断时间序列中的下一个元素的技术数据。当他打电话预测下一个冬天自行车租赁的使用量时,模型预测骑自行车的次数可能为负数--这是不可能的,但是对于软件来说,在人类设定这个领域可以接受的数值之前,这只是另一个数字而已。
 
“这是一些自动模型面临的挑战之一,”他说。“从算法的角度来看,就是如何调整引擎来处理任意数据集,而不必自定义所有的数据集?”
 
Explain Data对于升级到Tableau2019.3的企业是免费的。其他改进包括在门户或内部网页中嵌入了早期的AskData功能以鼓励更多的使用,以及在静止时加密所有提取数据的能力。
 
目录和服务器管理组件
 
Tableau 也为后台发布了新软件。Tableau Catalog是数据管理附加组件的新成员,它使分析师能够识别谁在使用哪些数据源,以及哪些报表依赖于哪些字段。这将有助于确定更改对收集数据的影响。
 
还有一个新的服务器管理附加组件,它能够监控大规模部署中的硬件资源使用情况和查询性能。它还可以帮助在项目或服务器环境之间进行内容迁移。对于在Amazon Web Services上运行Tableau的企业来说,有一个新的选项可以用于在Amazon RDS PostgreSQL中外部托管Tableau的元数据存储库,Tableau说这可以提高其可伸缩性和可用性。
 
对于运行自己安装版本的企业,Tableau服务器管理附加组件每个用户每月的成本为3美元;该公司表示,其产品Tableau Online是Tableau的SaaS版本,它的用户已经从这项服务中获得了性能管理和扩展优势。
 
版权声明:本文为企业网D1Net编译,转载需注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。

关键字:CIO自然语言工具

原创文章 企业网D1Net

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^