薄膜电容器数据挖掘与分析
2024-02-25刘羽霄张涌新钟少龙王昕劼黄磊吴致远王健涛党智敏
刘羽霄,张涌新,钟少龙,王昕劼,黄磊,吴致远,王健涛,党智敏
(1.清华大学电机系新型电力系统运行与控制全国重点实验室,北京 100084;2.华北电力大学电气与电子工程学院新能源电力系统国家重点实验室,北京 100096)
0 引言
电容器是当前电力电子产品和电力系统不可或缺的器件之一,而薄膜电容器因其使用寿命长、可靠性高而在各个领域都得到广泛应用,如电力电子转换器、电机驱动、电动汽车等[1-2]。预计未来不同行业对薄膜电容器的需求量也会稳步增长,到2024 年其需求数量可达近10 亿[3]。2019~2024 年世界对薄膜电容器的需求量见图1。
图1 2019~2024年世界对薄膜电容器的需求量Fig.1 Demand for film capacitor from 2019 to 2024 in the world
关于薄膜电容器的研究层出不穷,以提高储能密度为目标,Yang 等通过研究制备了一种Bi2Ti2O7介质薄膜,其具有微观结构进而提高了击穿场强,最终能量密度可达182 J/cm3[4];郑明胜等将其制备的薄膜材料组装成电容器后测试其性能,结果发现其循环稳定性好,储能密度也可达到3.2 J/cm3[5];冯启琨等对其自主制备的柔性薄膜进行了性能表征,能量密度可达7.03 J/cm3[6];Liu 等讨论了具有耐高温特性的聚酰亚胺(PI)电介质的发展,并对未来电容器耐高温、高储能密度的研究方向做了进一步阐释[7];Zhang 等利用三维结构的HfO2通过离子刻蚀的方式制备在微机电系统中应用的薄膜电容器,能够获得相比平面结构更高的储能密度,测试发现其储能密度可达28.94 J/cm3[8];Feng 等从材料角度出发提出制备一种三明治结构的新薄膜材料,实现了较好的热、介电和储能性能[9]。
在研究电容器老化特性和数据提取方面,叶润峰等从老化的角度出发比较了3 种类型的电容器能量密度衰减特性,说明其制备的复合薄膜有更好的能量保持率[10];Zhang 等在室温和常规湿度下观测并记录的薄膜电容器的衰减特性,计算得到各薄膜电容器电容值随时间变化曲线之间的皮尔逊相关性系数发现他们存在很强的关联性,因此可以利用某一条衰减曲线去估计同一环境下其他电容器的老化规律,实现了较好的预测效果[11];Miao 等提出一种能够在不同湿度条件下预测直流支撑电容老化特性的统一预测模型,通过引入虚拟变量能够提高回归的预测精度,相比于传统韦伯分析可以更好地考虑变湿度情况下的寿命预测[12];Zhang 等利用超过60 000 条电容器的容值数据进行神经网络的训练及预测,最后能够根据容值预测出适合的电容器材料,为电容器的性能预测开辟了一条新的道路[13];Cui 等测试了4 种卷绕制备压力下双向拉伸聚丙烯电容器的性能,发现卷绕压力过大(7 950 g)会提高电容器的介电损耗[14];Liu 等利用已有的电介质结构进行训练,能够使用机器学习中的生成模型得到新的潜在的聚合物结构,进而帮助未来的研究人员寻找更高性能的薄膜电容器材料[15]。
在研究薄膜电容器其他性能提升方面,Meng et al.(2023)在聚四氟乙烯(PTFE)上加入聚偏二氟乙烯(PVDF)涂层,相比于原始PTFE 击穿强度能够提高30.8%[16];Tan 等测试了在1~5 μm 下双向拉伸聚丙烯(BOPP)的击穿性能,并利用原子层沉积的方法来提高超薄BOPP 的击穿强度,室温下击穿强度相比原始材料能够提升10%以上[17];Dong 等对比了铝沉积在不同介电材料中的薄层电阻,发现沉积在聚对苯二甲酸乙二醇酯(PET)材料上时其载流能力最强,薄层电阻小的同时自愈特性也最好,是未来一种可行的沉积方案[18];Pei 等对抑制电介质损耗的方法进行了详细的介绍,同时也提供了多种电介质材料的设计方法,有望在未来提高电容器的储能密度[19]。
虽然有关薄膜电容器的研究已经积累了很多,但是已有研究并未充分释放隐藏在薄膜电容器数据后的潜在价值。大部分研究只是关注在同一条件下某一指标的单个数值,如Yang 等提到的182 J/cm3[4],涉及大量薄膜电容器数据潜在关联关系的探究较少。此外,以上研究大部分都是在实验室中探索新的材料或者追求薄膜电容器更优异的性能,却很少能够从商业化产品中去分析电容器的各项性能指标,而往往商业化产品数据与实验室数据存在一定的偏差。因此本文希望利用已经投入商业化运行的电容器的相关数据来弥补实验室数据的部分缺陷,并通过对薄膜电容器的各项性能指标进行综合分析对比,从数据角度出发寻找薄膜电容器性能参数的内在关联性,并总结其发展规律,为后续薄膜电容器乃至其他电气电子设备的数据利用提供一定的参考。本文涉及到的有关数据或信息见附录。
本文的研究框架思路见图2,首先进行最底层的纵向分析和横向分析,对数据进行可视化呈现并比较后,最后进行相关性分析,寻找数据内部的关联性。
图2 研究框架Fig.2 Research framework
1 电容器横向数据分析
选取来源于网络已商用的68 230 条薄膜电容器的数据作为分析基础,其中每条数据包含电容器供应商、价格、尺寸、组装方式、运行温度等多项信息。由于整体信息数据量过多,本文暂时先关注电容器的容值、制备材料、交直流运行电压、运行温度和应用场合共5 种性能指标或运行参数。由于部分电容器的上述数据存在缺失,因此首先将缺失任一分析指标的电容器数据剔除。
剔除完成后还剩下40 793 条薄膜电容器数据,由13 种材料制备而成,由于材料属性包括金属化(metallized)和金属化堆叠(metallized-stacked),这里将二者分别记为M 和MS 标注在每种材料后。这13 种材料对应的电容器数目见表1。
表1 电容器材料中英文对照表Table 1 Comparison table between Chinese and English forcapacitor materials
由上表可以看出,由金属化聚丙烯材料制备而成的薄膜电容器数目最多,也证明了其是目前商业化最成熟的制备材料。其次是则是聚酯纤维和聚酯纤维-聚对苯二甲酸乙二醇酯。剩余材料只是少规模的存在,也即是少量的厂家仍在生产,其中最少的是金属化堆叠的聚酯纤维。
1.1 容值对比
从材料数目由多到少绘制介电材料和容值的散点图见图3。
图3 电容器容值对比Fig.3 Comparison of capacitance of capacitor
在原始数据中,容值存在pF 和μF 两种表示方法,为了便于绘图,统一将pF 转换为μF。由图3(a)可以看出金属化聚丙烯薄膜电容器容值范围最广,上限最大,可以覆盖到几μF 至一千μF;而聚酯纤维最大可以到500 μF 左右,金属化堆叠聚酯纤维-聚对苯二甲酸乙二醇酯可以达到100 μF,而没有堆叠的聚酯纤维-聚对苯二甲酸乙二醇酯容值可以进一步提升到200 μF 以上。
其余材料制备成的薄膜电容器容值较小,在整体对比图中容值均接近0,为了进一步看出其大小,绘制其余材料的容值分布散点图见图3(b)。从大部分散点数据看,其中仅有金属化堆叠聚酯纤维-聚萘二甲酸乙二醇酯、金属化聚苯硫醚和金属化纸可以达到接近5 μF 左右的容值,其余材料均在1 μF左右。少量数据如金属化聚苯硫醚可以达到20 μF以上,金属化纸可以达到10 μF,但也仅仅是一个数据点,说明可能大部分生产厂家都无法利用这种材料生产更高容值的薄膜电容器。
由上述比较可知,不同材料制备而成的电容器容值存在显著差异,为了进一步解释不同材料容值的差异,可以首先从容值的定义出发,电容器的容值计算公式为
式中:C为电容器容值,F;ε0为真空介电常数,8.85×10-12F·m-1;εr为相对介电常数;S为极板面积,m2;d为薄膜厚度,m。
式(1)考虑的是单层薄膜,但实际器件为多层薄膜卷绕制成,应在此基础上进行修正。文献[20]建立了材料与器件容值的对应关系,得到材料属性后器件容值应修正为
式中:S′为等效面积,m2;d′为金属化层厚度,m。
可以看出,电容器的容值与相对介电常数、等效面积、薄膜厚度与金属化层厚度有关。由于已收集的40 793 条薄膜电容器数据并不包含介电常数等信息,所以只能利用已有材料数据进行比较。以金属化聚丙烯材料为例,其相对介电常数通常可以达到2.2②(Feng et al.,2021)[2],但是进一步提升相对介电常数通常比较困难;而目前金属化聚丙烯薄膜通常可以制备达到5-15 μm(指薄膜厚度)的程度(许然然等,2018)[21];至于等效面积取决于设计的电容器尺寸,不同的应用场合有不同的尺寸需求。目前其余材料的相对介电常数和工艺水平见表2。
表2 电容器应用场合中英文对照表Table 2 Comparison table between Chinese and English for capacitor applications
由表2 可以看出各种材料的介电常数相比容值的差异微乎其微,除丙烯酸外各个材料目前的工艺水平也没有大的差异,这说明不同材料电容器容值的差异主要体现在其等效面积上。而等效面积如前文所述取决于电容器卷绕的大小尺寸,这在很大程度上是由其具体应用场合(包括环境温度、交直流运行电压等等)决定的,亦或者出于成熟度、可靠性、成本等的考虑对于大型电容器只采用某几种类型的材料制备。因此在图3 中金属化聚丙烯电容器因其大尺寸容值可以高达1 000 μF,而其余电容器因其小尺寸容值较低。
由上述分析可以看出,不同材料电容器的容值可能与其运行温度和交直流运行电压相关联,因此接下来将对二者进行对比分析。
1.2 运行温度对比
绘制不同电容器的运行温度对比见图4。在原始数据中,所有电容器的运行温度都是一个范围值,比如-55~110℃,无法直接绘制图像进行比较,因此这里将温度分别拆分为最高运行温度、最低运行温度和运行温度范围分别绘制其箱线图(能够以箱体的方式来呈现数据的范围,箱体主要由上四分位数、平均值、下四分位数组成,此外还有一些离群点会标注在箱体外部)进行比较,分别对应图4 中的(a)、(b)、(c)。而具体的运行温度范围将在后续电容器纵向数据分析中以单种材料的饼图进行展示。
图4 电容器运行温度对比Fig.4 Comparison of operating temperature of capacitor
由图4 可以看出,在最高运行温度方面,金属化聚苯硫醚最高运行温度可以超过140 ℃,是最高的,而最成熟的金属化聚丙烯最高运行温度在110℃左右;在最低运行温度方面,基本上所有材料的温度都分布在-55 ℃到-40 ℃;最后看温度范围,最宽的依然是金属化聚苯硫醚,可超过200℃,金属化聚丙烯基本在130℃到180℃之间。
文献[2]在本征耐热聚合物中也提到聚苯硫醚材料的工作温度一般在200 ℃到240 ℃,最高可到260 ℃,其制备成电容器后继承了其耐热特性,但运行温度最高只达到了140 ℃,保留了比较多的安全稳定裕度。其余材料电容器可能也会因为工程安全考虑保留较大的安全空间而并没有接近其极限参数,因此器件的实际参数可能与材料参数有所不同。
在图4 中,后4 种材料无论是最高运行温度、最低运行温度还是运行范围都只是一个值。由表1可知这几种材料的电容器数目均少于20,因此可能是由于样本量过少而导致数据相对集中,但这也从另一个角度说明可能这些电容器的规格已经被限制在了这一水平。
1.3 运行电压对比
进一步比较各个材料制备而成的电容器的交直流运行电压,绘制箱线图见图5。某些电容器的交流运行电压可能不止一个,如在原始数据中存在480 V、530 V 两种运行电压,这时取最大的运行电压最为绘图参数,即尽可能考虑其极限参数。观察直流运行电压可以发现,金属化聚丙烯和金属化纸占据优势,平均值可以达到250 V 以上,金属化聚丙烯也有一些产品可以达到1 250 V 以上,剩下材料电容器的直流运行电压均比较低。观察交流运行电压,金属化聚酯纤维可以高达10 000 V,而金属化聚丙烯也可以高达6 000 V。
图5 电容器运行电压对比Fig.5 Comparison of operating voltage of capacitor
当将电压范围限制在2 000 V 时,如图5(c)所示,可以看到金属化聚丙烯和金属化纸在交流方面也占据优势,上四分位数可以达到1 000 V 左右。其中,金属化丙烯酸、金属化聚酯纤维-聚萘二甲酸乙二醇酯和金属化堆叠丙烯酸的交直流运行电压在10 几V 左右,在图中看到几乎为0,可能是其应用场合不同所以不需要很高的运行电压,或者可能其不太适合用于高压场合。
定性看,不同材料电容器容值、运行温度、运行电压之间的相关性并不显著,金属化聚丙烯电容器的容值范围最宽,但是在运行温度上和绝大多数材料相近,而在运行电压方面仅仅占据些许优势;反观金属化纸电容器容值、运行温度都比较低,但是其交直流运行电压的平均值却能够和金属化聚丙烯相接近,因此可以认为运行温度与交直流运行电压并不是限制容值的主要因素,而可能材料的使用寿命、可靠性、损耗等方面才是限制容值增加的主要因素。对于3 者之间相关性的定量分析将在第3部分进行。
1.4 金属化与金属化堆叠材料属性影响
在上述分析当中,并没有对金属化和金属化堆叠两种材料属性的影响进行讨论,为了判断二者的不同是否会显著影响电容器的相关性能参数,可以采用假设检验的思想,均值显著不同则认为存在显著影响。由于两总体的分布均未知并且数据量不等,为了判断均值是否相等可以采用不等方差t检验(unequal variancet-test)的方法(Ruxton,2006)[30]。这一检验核心思想与t检验类似,构造检验统计量为
式中:为第1 组样本均值;yˉ为第2 组样本均值;μ1为第1 组总体分布均值;μ2为第2 组第1 组总体分布均值;为第1 组样本方差;为第2 组样本方差;n1为第1 组样本量;n2为第2 组样本量。
因为假设检验中判断总体均值是否相同因此式中μ1-μ2=0,统计量的自由度v可以表示为
通常按照式计算得到自由度v并非整数,因此向下取整,令v=。在给定显著性水平α的情况下,拒绝域W={|t′ |≥tα2(v)},而在实际使用中计算得到检验统计量后利用计算机可以直接求得α的值。
除了纸电容器以外,其余材料制备而成的电容器均有金属化与金属化堆叠两种材料属性,以容值为例(运行温度与运行电压的假设检验计算结果可见附录),对这6 种材料制备而成的电容器进行假设检验的结果见表3。
表3 容值假设检验结果Table 3 Hypothesis test results of capacitance
由表3 可以看出,除了丙烯酸外,其余材料的显著性水平基本均为0,说明金属化与金属化堆叠两种材料属性对电容器参数是有显著影响的。并且表3 中的检验统计量t′均为正值,那么可以认为金属化电容器的容值显著高于金属化堆叠电容器的容值。
2 电容器纵向数据分析
上文从不同电容器材料的性能参数进行了比较,从横向的广度进行分析,下文对单种材料制备而成电容器的性能进行数比较。这里选择电容器的运行温度和应用场合进行分析,对电容器的运行温度进行分析后可以较为全面的了解到目前商业化电容器耐热的现状,有利于后续建立类似电容器的数据库,从而便于数据分析处理;此外,也能让我们对电容器材料与温度的对应关系有更深入的理解,为后续电容器选择决策或者深入研究电容器做好一定的准备工作。而应用场合也是同理,可能会帮助我们发现某一种材料其特殊的应用场合,或者发现电容器的温度运行范围会在一定程度上限制其应用场合。对电容器性能参数进行纵向比较能够在一定程度上帮助我们了解此类电容器的发展现状。
事实上,正如前文所说,影响电容器最终性能的因素还有很多,如尺寸、封装方式、成本等等,文章选取了两种最为常见的参数进行分析,后续可以进一步完善其他因素的影响。
2.1 温度分析
绘制单种材料电容器运行温度占比图见图6,由于后面4 种材料的运行温度范围只有一种,因此并没有在图中进行展示。
图6 单种材料电容器运行温度占比Fig.6 Operating temperature proportion of single material capacitor
由图6 首先可以看出金属化聚丙烯和金属化聚酯纤维的运行温度范围种类是最多的,这与其产品数量也是密切相关的,因为其产品种类多,因此运行范围也比较多。从占比看,金属化聚丙烯最多的运行温度范围是-55~110℃,占比31.8%;而金属化聚酯纤维最多的运行温度是-55~105 ℃,占比51.1%。在其余材料中,绝大部分材料的最高占比运行温度的下限都是-55 ℃,3 种复合材料占比最高的运行温度范围均是-55~125 ℃;值得注意的是金属化纸的几项温度占比都比较平均,说明其可以在多个温度范围中工作。
2.2 应用场合分析
继续绘制单种材料电容器应用场合占比图见图7。数据条数最多的金属化聚丙烯应用场合也最多,可以用于三相、换向、电动机运行等各种场合,其中占比最多的三项分别是DV/DT,高脉冲和高频场合,也就是说其主要用来抑制电压的快速变化;金属化聚酯纤维则在一般用途占据绝对优势,占比71.3%;聚酯纤维-聚对苯二甲酸乙二醇酯这种材料在汽车中使用最多,其次是用于射频干扰抑制;聚酯纤维-聚萘二甲酸乙二醇酯除了一般用途之外,也是最常用于汽车,占比39.2%;而金属化纸薄膜电容器主要用于射频干扰抑制和电磁干扰。其余没有绘制在图中的材料均是一般用途。
图7 单种材料电容器应用场合占比Fig.7 Proportion of single material capacitor application
仅从图6 与图7 之间的相互对比可以发现,运行温度并不会直接限制电容器的运行场合,比如运行温度最高的金属化聚苯硫醚最常用于一般用途,而运行温度一般的金属化堆叠聚酯纤维-聚萘二甲酸乙二醇酯也是最常用于一般用途。但实际聚苯硫醚材料可应用于特种高温环境中[2],因此图7 展示的应用类型并不全面,只是呈现出了最基础的一些应用类型。
3 电容器参数相关性分析
上文从横纵向的角度分析比较了不同电容器的参数,但是并没有揭示各个参数之间的相互关系,可能某个参数是强耦合与另一个参数的,因此需要进一步作相关性分析。一个比较简单的相关性分析是计算两组数据的皮尔逊相关性系数,计算方法如下(Cohen et al.,2009)[31]:
式中:n为每组数据个数;Xi为第一组数据第i个分量;为第一组数据平均值;Yi为第二组数据第i个分量;为第二组数据平均值。
考虑到电容器的性能参数可能与材料有关,因此在计算相关性系数时想要将材料纳入其中,但由于相关性系数计算需要使用具体的数据值,因此采用和文献[13]相同的做法将材料编号,见表4。
表4 最低温度假设检验结果Table 4 Hypothesis test results of minimumtemperature
此时对材料进行的编号是依据其数据个数从小到大依次编号,因此如果有数据与材料呈现绝对值比较大的相关性系数,就有理由认为这项属性与材料的成熟度或者应用程度有关联。
理论上对应用进行编号后,也可以进行相关性分析,但是这里是将某一个电容器的综合应用拆分为了小的应用,在计算相关性系数时数据个数相比于之前发生了变化,因此这里先不考虑给应用编号及计算其与其他性能参数的相关性系数。此外,对于应用编号其数值大小的意义无法明确。
将计算得到的皮尔逊相关性系数绘制成热力图如图8 所示。整体上看,只有温度范围和最高温度以及交流电压和直流电压的相关性系数高于0.9,这说明在电容器参数的设计上,最高温度越高,温度范围越广,交流运行电压越高,其相应的直流运行电压也越高,与直观认识相符合。其余属性并没有呈现出很高的相关性,虽然材料和最高温度、交直流运行电压的相关性系数为0.3,高于剩余属性的相关性系数,但仍不显著,这说明材料的成熟度只在很小程度上影响电容器的性能,而除材料之外的其他影响因素如电容器的设计对电容器性能的影响也有较大的潜力。
图8 电容器性能参数相关性分析热力图Fig.8 Thermal dynamic diagram for correlation analysis of capacitor performance parameters
4 结语
1)本文利用40 793 条薄膜电容器数据对电容器进行纵向数据分析,发现在容值上金属化聚丙烯电容器占据绝对优势,可以达到1 000 μF;金属化聚苯硫醚的运行温度最高;金属化聚丙烯和金属化纸的交直流运行电压最高。
2)本文对单种材料进行纵向分析表明,绝大部分材料占比最高的最低运行温度为-55 ℃,而金属化聚丙烯占比最高运行温度范围为-55~110 ℃;在应用场合方面,金属化聚丙烯最多使用在DV/DT,高脉冲和高频场合,金属化聚酯纤维常用于一般用途。
3)针对电容器性能参数的相关性分析表明,除去温度和交直流电压外,没有强相关的性能参数,也就是说,电容器的各项参数或许可以是独立存在的,未来技术成熟度不高的电容器材料也有可能发挥极致的功效。
4)经过以上分析可以看出,虽然金属化聚丙烯电容器在市场中占据主体地位,从市场竞争方面考虑其他电容器均处劣势;但从应用发展方面考虑,其他电容器都能找到自己合适的应用场景而没有在劣势市场中销声匿迹,说明其他电容器仍具备一定的发展或者应用潜能。本文认为,未来电容器的发展会朝着“中心突出,百花齐放”的形式进行,金属化聚丙烯电容器仍将最为主要的商业化电容器进一步发展,但在特殊应用场合如高温仍有其他电容器的需求(如金属化聚苯硫醚电容器),其余材料种类电容器也会逐步提升性能,在各个行业得到不同的利用。
5)目前,针对已有数据进行初步分析是一项重要的起点,但未能充分利用所有的性能参数如结构、封装方式及进一步利用机器学习等先进方法来提取数据内部特征可能限制了本文对于电容器的综合理解。未来的探索方向之一是利用机器学习等方式,从大量数据中提取电容器内部特征,通过建立复杂的算法模型和数据分析策略,可以深入研究电容器内部参数的关联机制。此外,数字孪生技术在电容器领域的应用也是未来的一个发展方向。通过将真实电容器的物理特性、运行状态和故障模式建模为虚拟的数字孪生模型,可以实现电容器全生命周期的检测和监控。数字孪生技术能够模拟电容器的工作过程,并预测其性能变化、寿命衰减以及潜在故障风险,为电容器设计、运维和维修提供更精确的指导和决策支持[32]。
附录
表1 不同电容器材料数目Table 1 Number of different capacitor materials
表2 不同材料的相对介电常数与工艺水平Table 2 Relative dielectric constant and process level of different materials
表3 最高温度假设检验结果Table 3 Hypothesis test results of maximum temperature
表4 电容器材料编号Table 4 Number of different capacitor materials
表5 温度范围假设检验结果Table 5 Hypothesis test results of temperature range
表6 交流电压假设检验结果Table 6 Hypothesis test results of AC voltage
表7 直流电压假设检验结果Table 7 Hypothesis test results of DC voltage