昨天说到用VBA做多条件单汇总的分组,要怎么个做法呢?
VBA这个东西其实我并不太熟悉,我没有系统学习过,或者说其实是系统过的,但只是皮毛,而且已经是多年以前了,之后用得不多,所以忘记得差不多了。所以现在我只是需要用什么的时候就去研究。在开始之前实现我的目标之前,我也先去搜索了,得出大概两个方案,一个是用字典,另外一个是用SQL。就思路来说,我感觉SQL比较直接,因为那调用的是列的信息,各种聚合会非常方便。我不知道VBA里面的SQL到底是怎么个执行法。因为2003或者以前的office,如果要做跨表查询就得用SQL。我已经不记得那些跨表查询到底只是一个工作簿里面不同表,还是直接可以跨不同的工作簿,但可以肯定的是,如果某Excel文件里运用了SQL,那么这个Excel文件一旦移动,比如发给了别人或者是U盘拷贝到另外一台电脑就会查询失败。之所以这样是因为实际上Excel在电脑的某个地方存储了与SQL有关的某些东西。虽然你把Excel文件挪走了,但是存储在你电脑里面的某个东西还在原来的地方,那是一个绝对地址。不管那个到底是绝对地址还是相对地址,简而言之就是实际上你只能挪走了一部分的东西,另外一部分还在那个地方,但即便你那么高难度,那个电脑深处的东西也挪走了。即便把它像放在另外一台电脑相对位置一样的地方,但还是识别不出来。所以最终你只能放弃那个查询,然后贴同样的代码,在另外一台电脑上重新建一个,这个操作很逆天,非常不方便。正是因为我知道这个,所以虽然在合并查询上SQL很方便,但是不到迫不得已我不会这么干。如果我真要这么干,我就不用Excel,我用了Access。以前的 Office 2003专业版都是自带Access。说起数据库的操作,在那个地方用SQL就很自然。
想到分组的时候,我当然有考虑过SQL,但是我知道以前的Excel对这个很不友好。所以别人做的某些方案,SQL版本干的事情很简单,但前面一大堆的参数引用会让你眼花缭乱。相对而言,字典是VBA的原生,所以说VBA一定能很好支持,因为VBA的字典是提升VBA性能的一个重要体现。我觉得不仅仅是在VBA,在python里,用字典和不用字典做同样的查询,效果差别也非常明显。我想要的多条件单汇总要怎么做字典呢?我首先想到的当然是把条件都合并起来作为键,然后把要汇总的那个作为键值。这就保证了前面那些条件一定是唯一的,后面的键值做累加就行了。当然,你也可以不把前面所有条件都合并成键,你只需要把一些特征条件合并就行。把多条件合并起来,做一个循环,用分隔符把它们连起来就可以了。耗费我比较长时间的是,我建立了这个字典以后,我就需要把键和键值都输出重新组合成一个数组,那就是我想要的多条件单汇总结果。但问题是怎么才能把合并起来的键重新分解输出呢?我研究了半天。理论上被我连接起来的那些条件放的键实际上是一个字符串,而且里面有规律的分隔符。我利用分隔符就能把它重新打开,然后我新建一个数组接收这些被打断的字符串。这个接收了打断字符串的数组外加字典的键值,合并起来再复制给新的数组就是我想要的东西。思路是这样的,但是当我要执行的时候,我却一直卡在那个地方。关键就我在定义这个接受打断字符串数组的时候加了括号。为什么其它数组在定义的时候就得在名称后面加括号,但是这种接收字符串的数组在定义的时候就不能加呢?这个是我搞不懂的。事实是不加我就可以实现功能,加了就会说类型错误。这种接收打断字符串的东西不应该称作数组?我已经不记得到底我是从哪里学回来的这一招接收打断字符串形成数组的这种做法。生成一个表格标题的时候,这样做非常简单高效。
先把多条件合并成一个字符串,然后再把这个字符串打断。这种方案我在网上也看到了,别人也是怎么干,但是别人之所以没有像我这样卡住,是因为把字符串打断的时候他们并不是赋值给数组,而是直接在单元格里输出了,于是他们也就没有定义数组名称时加了个括号就卡住的烦恼。
最终,我实现了自己的目标用VBA接收源数据,然后进行加工处理,做一个多条件单汇总,最终在一个固定格式的表格里输出并另存为一个新文件。整个过程你只需要在VBA所在的文件里面按一下初始化按钮,然后把需要整理的数据贴进去,然后再按一个相应的生成文件按钮。文件生成的过程可以说是秒杀,几乎不需要时间。生成的文件会自动保存在VBA文件的相同目录。这个VBA文件你可以点保存,整理后的文件内容也会在VBA文件的相应页面输出。如果你需要查询,直接可以在那里看,如果你根本不想看,这个VBA文件你甚至不需要按保存。因为如果粘贴源数据前内容是空的,下一次你再进来的时候就不需要初始化,所以步骤就更为简单,下一次你只需要做粘贴以及点一下生成。明明转换这些数据很简单,VBA可以秒杀完成,为什么PQ就得转那么好几秒呢?之所以在做这个事情上我不做python方案,是因为你还得把源数据贴到Excel里面,保存关闭,再按python生成。这就意味着。虽然你只打开关闭了Excel文件一次,但是python在运行的时候又得把Excel文件打开关闭一次,这样就得耗双倍的开关时间。如果数据量很大,VBA很慢,又或者那得进行多个文件的拼接才能取得一个很大的数据,汇总的数据超过了VBA的处理范围,那么可能我会选择python方案,但现在,顶多每次就几百条数据,难度是非常低的,高效完成是我最看重的,因此VBA是最佳选择。
用过VSCode以后,当我在Excel的VBA里编写代码,真的非常痛苦,因为当你一句话没写完,就要在其它地方复制某些东西过去的时候,就会给你弹窗报错。为什么你非得给我弹窗呢?你给我下面波浪红线不好吗?又或者当我要运行的时候,你才告诉我那个不对不行吗?我写一半就不写了,并不是因为那是我写错了,而是因为我需要做其它复制粘贴,又或者是切换个窗口做一下别的事情。如果能在VSCode面直接编写VBA,然后能直接在Excel里面调试运行,不需要把代码贴回VBA那么折腾该多好。
我可以忍受VBA的各种规则,但是我真的不喜欢Excel自带的VBE。
VBA多条件单汇总字典方案:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
| 'crr(i, 1 To 7)为数组,多行7列,前6列为条件,最后1列为数据,需要汇总
Set dic = CreateObject("scripting.dictionary") '建立字典
For i = 1 To UBound(crr)
x = crr(i, 1)
For j = 2 To 6
x = x & "|" & crr(i, j) '合并分组依据
Next
dic(x) = dic(x) + crr(i, 7)
Next
Dim err, frr() As Variant
ReDim frr(1 To dic.Count, 1 To 7) '新汇总数组
i = 1
For Each x In dic.Keys
err = Split(x, "|") '打碎分组依据
For j = 0 To 5
frr(i, j + 1) = err(j)
Next
frr(i, 7) = dic(x)
i = i + 1
Next |
'crr(i, 1 To 7)为数组,多行7列,前6列为条件,最后1列为数据,需要汇总
Set dic = CreateObject("scripting.dictionary") '建立字典
For i = 1 To UBound(crr)
x = crr(i, 1)
For j = 2 To 6
x = x & "|" & crr(i, j) '合并分组依据
Next
dic(x) = dic(x) + crr(i, 7)
Next
Dim err, frr() As Variant
ReDim frr(1 To dic.Count, 1 To 7) '新汇总数组
i = 1
For Each x In dic.Keys
err = Split(x, "|") '打碎分组依据
For j = 0 To 5
frr(i, j + 1) = err(j)
Next
frr(i, 7) = dic(x)
i = i + 1
Next