数据聚合是数据合并的过程,将来自不同数据源的数据综合在一起。聚类分析,也被称为群集分析,是统计数据分析的一种技术,在众多领域广泛应用,包括机器学习、数据挖掘、模式识别、图像分析和生物信息学。其目的是将相似的对象分组到不同的集或子集,使得同一子集中的成员具有相似的属性,常见的分组依据是空间距离的近似。 常见的聚类算法包括Kmean聚类,通常被归类为非监督式学习。例如,在使用Tableau进行数据可视化时,可以进行数据聚合,以在视图中合并度量。默认情况下,Tableau会对添加到视图中的度量应用聚合,常见的聚合类型包括总和、平均值和中值。 您可以根据需要更改视图中的度量聚合。例如,从维度上下文菜单选择“属性”可以创建一个临时度量列,以实际方式处理维度。注意,Microsoft Access 数据源以及使用旧连接的 Microsoft Excel 和文本文件数据源不支持“计数(不重复)”聚合。使用“计数(不同)”聚合时,如果数据源未提取,则将显示消息“需要数据提取”。如果提取数据源,您将能够使用“计数(不重复)”聚合。 在Tableau中预定义了多种聚合函数,用于生成聚合数据。这些聚合函数可以对一组值进行计算,并返回单个值。例如,对于包含1, 2, 3, 3, 4的某个度量,求和聚合将返回13。对于数据源中的50种产品和3000笔销售交易,您可能希望查看每种产品的销售总额,以确定哪些产品的收入最高。 在Tableau中,关系数据源中的度量只支持特定的聚合。多维数据源包含已聚合的数据,仅支持在Windows中使用。通过其上下文菜单,您可以更改视图中度量的聚合。 在Tableau中,聚合函数可以定义自定义聚合,根据创建的数据视图类型,Tableau将应用这些聚合以相应的详细级别。例如,对于单个维度成员(如东区平均交付时间)、某个维度的所有成员(如东、西和中区的平均交付时间)或维度组(所有地区和所有市场的销售总额),聚合应用于详细级别。 度量的默认聚合可以为非计算字段的任何度量设置,例如AVG([Discount])。您还可以为视图中已存在的字段设置聚合。使用“数据”窗格右键单击度量并选择“默认属性”>“聚合”,然后选择所需的聚合选项来更改默认聚合。 解聚数据是指Tableau为数据源每一行的每个数据值显示单独标记。默认情况下,Tableau尝试对视图中的度量进行聚合。聚合方式包括加总、求平均值、最大值或最小值。在分析时,解聚数据对于查看视图中的所有标记非常有用,特别是在使用散点图形式查看数据时。 创建散点图时,可以通过添加维度、向“行”和“列”功能区添加额外的度量和维度,以及解聚数据来添加详细信息。例如,通过添加“Category”维度,您可以将数据分隔成不同标记并使用颜色编码。将“State”维度拖到“详细信息”中,可以显示更多标记。尝试添加更多字段,或解聚数据来探索更多细节。



































