<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title><![CDATA[gOxiA=苏繁=SuFan Blog]]></title> 
<link>https://sufan.maytide.net/index.php</link> 
<description><![CDATA[gOxiA,苏繁,sufan,Microsoft MVP]]></description> 
<language>zh-cn</language> 
<copyright><![CDATA[gOxiA=苏繁=SuFan Blog]]></copyright>
<item>
<link>https://sufan.maytide.net/read.php/1875.htm</link>
<title><![CDATA[使用Excel 2016的获取和转换功能对Excel表格进行数据清洗]]></title> 
<author>gOxiA &lt;sufan_cn@msn.com&gt;</author>
<category><![CDATA[Microsoft Office]]></category>
<pubDate>Tue, 23 Jan 2018 08:19:50 +0000</pubDate> 
<guid>https://sufan.maytide.net/read.php/1875.htm</guid> 
<description>
<![CDATA[ 
	<p><a href="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/excel_banner.png"><img width="404" height="231" title="excel_banner" style="display: inline; background-image: none;" alt="excel_banner" src="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/excel_banner_thumb.png" border="0"></a></p>&nbsp;&nbsp;<p><strong><font color="#fd3f0d" size="4">使用Excel 2016的获取和转换功能对Excel表格进行数据清洗</font></strong></p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <a href="http://goxia.maytide.net" target="_blank">gOxiA</a> 之前有了解过 Microsoft PowerBI，所以对大数据的应用非常感兴趣。由于还处在入门阶段，所以目前仍在学习和实践，那么在日常工作中主要是通过处理一些数据表格文件，实现简单的数据清洗，使之数据浏览起来显得更加直观和清晰，以满足自己的需求。虽然整个过程非常简单，但也乐在其中，今天整理一下与大家分享，也希望能带给大家一些帮助和提示。</p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 在Excel 2016中提供了“获取和转换”数据的功能，简单理解呢就是对数据的查询和编辑功能，与 PowerBI 无本质差别，但整个的处理过程都是在Excel 2016中完成的，其价值也非常明显。</p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 例如 gOxiA 定期要处理一些 ITSM 相关的台账数据，并对这个导出的数据表进行无关数据的清洗和整理，最终编辑为 gOxiA 所需要的表格结构，及数据呈现方式。由于这个台账数据需要每一段时间导出一次，那就意味着每次都要重新进行清洗和整理，是相当繁琐和麻烦的，无形之中也会产生很大的工作量，带来工作压力。</p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 如果有一种软件可以实现基于这个原始台账进行编辑和生成，并可动态更新，岂不是高效太多！！！之前也想过用 PowerBI 来实现，但感觉当前的需求过于简单，也没有数据可视化需求，暂时没必要动用 PowerBI，后来发现了Excel 的数据查询（获取和转换）功能，如获至宝！</p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 微软官方对“<a href="https://support.office.com/zh-cn/article/%E5%85%A5%E9%97%A8%E8%8E%B7%E5%8F%96%E5%92%8C%E8%BD%AC%E6%8D%A2%E5%9C%A8-Excel-2016-%E4%B8%AD-a8310388-2a12-438c-9d29-c6d29cb8df6a" target="_blank">获取和转换</a>”的解释还是很到位的，虽然是机器翻译，但理解起来也并不困难。Excel 中，我们可以搜索数据源，并进行连接，然后根据需要筛选、更改、删除数据，也可以对表进行合并，以满足我们需要的方式，一旦数据表调整完毕，就可以共享我们清洗过的数据表格文件。</p>&nbsp;&nbsp;<p><img title="Power Query 常用步骤" alt="Power Query 常用步骤" src="https://support.content.office.net/zh-cn/media/e5c63e6e-3205-4803-8b4a-6e469a211089.png"></p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 如果按照顺序看“获取和转换”功能中的这些步骤，将发现其通常按照下面的方式进行：</p>&nbsp;&nbsp;<ul>&nbsp;&nbsp; <li>连接 - 建立与云中、服务内和本地的数据之间的连接</li>&nbsp;&nbsp;&nbsp;&nbsp;<li>转换 - 调整数据以满足你的需求；原始源保持不变</li>&nbsp;&nbsp;&nbsp;&nbsp;<li>组合 - 从多个数据源，创建数据模型，获得数据的独特见解</li>&nbsp;&nbsp;&nbsp;&nbsp;<li>共享 - 查询完成后可以将其保存、共享或将其用于报表</li> </ul>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 那么在具体应用中该如何操作呢？！举例来说，gOxiA 有一个定期从后台系统导出的台账表格，原始表格中包含很多无关的数据列需要删除；每行数据的排列顺序也需要重新整理；一些列的数据还需要进行筛选剔除无关数据；且数据类型也需要整理，便于后续的计算；还需要通过“条件格式”对一些数据进行自动标注；最后还需要从某列开始进行冻结以便于查阅。</p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 可以看出上述列出的一些修改实际上包含很大的工作量，如果仅仅是一次性表格，倒也无所谓直接在原始表格上修改，但是这个原始台账每个一段时间就要提取出来进行整理，可想而知会产生多巨大的工作压力。</p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 现在我们就利用 Excel 2016 内置的数据“获取和转换”功能简化上述的工作。首先准备好数据源，本例是一个Excel表格文档。然后新建一个Excel文件，切换到“数据”选项卡，找到“获取和转换”区域，并点击“新建查询”，如下图所示。</p>&nbsp;&nbsp;<p><a href="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/powerquery_excel2016.png"><img width="634" height="56" title="powerquery_excel2016" style="display: inline; background-image: none;" alt="powerquery_excel2016" src="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/powerquery_excel2016_thumb.png" border="0"></a></p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Excel 2016 支持从文件、数据库、Azure、在线服务和其他源，进行数据的连接和查询。在本例中选择的是从工作簿，即一个 Excel 文档。</p>&nbsp;&nbsp;<p><a href="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/powerquery_fromfile.png"><img width="329" height="451" title="powerquery_fromfile" style="display: inline; background-image: none;" alt="powerquery_fromfile" src="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/powerquery_fromfile_thumb.png" border="0"></a></p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 在随后选择完毕 Excel 文件后，便会弹出“导航器”，原始表格的默认查询已经预加载，我们可以选择选择要加载的工作表，或先执行编辑查询。</p>&nbsp;&nbsp;<p><a href="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/powerquery_addquery.png"><img width="634" height="505" title="powerquery_addquery" style="display: inline; background-image: none;" alt="powerquery_addquery" src="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/powerquery_addquery_thumb.png" border="0"></a></p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 加载查询后得到的结果即如下图类似，如果在上一步直接选择了加载，那么这里应该看到的是一个与原始表格基本相同的一个工作表。接下来我们就可以根据自己实际的需求对数据表进行修改，为此我们需要在 Excel 工具栏上切换到“查询”选项卡，然后点击“编辑”。</p>&nbsp;&nbsp;<p><a href="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/powerquery_querylist.png"><img width="634" height="336" title="powerquery_querylist" style="display: inline; background-image: none;" alt="powerquery_querylist" src="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/powerquery_querylist_thumb.png" border="0"></a></p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 在弹出的“查询编辑器”中我们便可以对工作表数据进行按需清洗，操作过程如同我们编辑 Excel 一样，当完成编辑后，便可点击“关闭并上载”来刷新我们的当前工作表，实现最终的工作表视图结果。之后就可利用一些Excel常规的编辑功能对表格内容进行修饰。</p>&nbsp;&nbsp;<p><a href="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/powerquery_edit.png"><img width="617" height="336" title="powerquery_edit" style="display: inline; background-image: none;" alt="powerquery_edit" src="http://goxia.maytide.net/ftpup/2017/Excel-2016_CE39/powerquery_edit_thumb.png" border="0"></a></p>&nbsp;&nbsp;<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 当过了一段时间，原始表格数据进行了更新，我们只需要在“查询”选项卡中，点击“刷新”即可将新数据应用到当前工作表中。而之前我们所做过的筛选、修改、删除等操作都会继续应用到新数据上，无需再次整理。</p>
]]>
</description>
</item>
</channel>
</rss>