MicroStrategy ONE
导入前优化数据质量
导入数据前,使用数据整理可提高数据的质量和可用性。您可移除空格、筛选器、删除重复的行或单元格、查找和替换数据、连接列等等。此外,您可使用数据整理作为数据发现工具,并绕过一些传统提取、转换和加载 (ETL) 方法。
在“整理数据”对话框中,使用示例数据(即实际数据的一个子集)构建一个函数脚本,用于清理、转换和准备数据。
如果您重新发布或刷新您的数据,数据整理步骤将应用至新数据。
- 创建空白达析报告或打开现有的达析报告。
-
选择添加数据
> 新数据,将数据导入新的数据集。或
在数据集面板中,点击更多的
在数据集名称旁并选择编辑数据集来将数据添加至数据集。这时将打开“预览”对话框。单击添加新表。这时“数据源”对话框将打开。
- 按照您的数据源类型,选择您要导入的数据。
- 选择要导入的数据后,单击准备数据打开“预览”对话框。
- 在顶部窗格中,单击要修改的表的下拉箭头并选择整理。“数据整理”对话框将打开,显示数据集的示例。
从选择列下拉列表选择要修改的列。
或
在预览中选择要修改的列。
从建议列表或选择函数下拉列表选择要应用的函数。有关更多信息,请参阅用于整理数据的功能。
如果函数不需要进一步输入,它会自动应用到数据。
如果函数需要参数,定义函数并单击应用。
您可更改列的日期数据类型。在选择列下拉列表中,选择您要更改的列。在转换单元格选项下的选择函数下拉列表中,选择更改数据类型。从下一个下拉列表选择日期,在随后的字段中输入日期格式,然后单击应用。请参阅在整理数据时定义日期和时间数据类型的方法,了解更多信息。
您可使用选择函数下拉列表的选择器选项来筛选列数据。这些选项在屏幕顶部显示以下筛选器,您可进行调整以筛选列。
文本选择器:悬停在文本上并选择将其包括在导入中还是从导入排除。
数字选择器:显示具有数值范围的图表。移动范围的起点和终点来筛选值。此外,使用数值、非数值、空白和错误可进一步筛选数值。
时间线选择器:显示具有日期范围的图表。移动范围的起点和终点来筛选日期。此外,使用时间、非时间、空白和错误可进一步筛选日期。
文本搜索:输入您要通过其筛选数据的文本。选择区分大小写可使搜索区分大小写。选择正则表达式可使用正则表达式 (Regex) 语言。
使用“选择器”选项不会删除数据。相反,数据从预览隐藏。
您可通过选择与每个筛选器关联的下拉箭头将函数应用到筛选的数据。
重置:撤消特定筛选器。
重置所有选择器:撤消全部筛选器。
删除:删除特定筛选器
删除所有选择器:删除全部筛选器。
- 要将类似的列数据分组为群集并替换值,选择您要修改的列,然后从选择函数下拉列表的其他部分选择建立群集并编辑。“群集和编辑”对话框打开,其中具有划分到相关数据群集中的列数据。有关更多信息,请参阅群集数据的方法 。
- 双击单独的单元格可在该单元格中直接编辑数据。
- 在弹出对话框中输入您的更改。
- 单击应用
对所选单元格进行更改。 - 单击应用到全部
对匹配所选单元格中数据的所有单元格进行更改。 - 在“历史脚本”区域中单击撤消
可撤消上一函数。 - 单击恢复
可恢复上一函数。 - 要撤消多个函数,单击您要保留的前一函数。所选函数之后的所有函数均被撤消。撤消某个函数后,它将显示为灰色。
- 要恢复多个函数,单击您要恢复的最新灰显函数。所选函数和该函数之前的函数均重新应用。
- 要撤消脚本中的所有操作,单击重置
。您的数据将恢复为原始状态。历史脚本将不会删除,直到您选择另一个函数启动新脚本。 - 单击保存
。“提取历史脚本”对话框打开,显示完整脚本。 - 单击保存可保存脚本及其函数,稍后供其他数据集重复使用。
- 单击关闭可返回“数据整理”对话框而不保存脚本。
- 单击导入
。这时将打开“导入历史脚本”对话框。 单击浏览可导入保存的脚本。
或
将脚本粘贴到文本框中。
- 单击应用。脚本针对您的数据示例运行,并返回到“预览”对话框。
- 单击完成可导入您优化的数据。
