我在服务器电源(PSU)这个圈子干了十来年,从白金效率到钛金效率,从分立方案到数字控制,经手过几百款产品。数据中心对电源的要求就三个字:稳、小、省——稳定不能掉链子,功率密度要高,效率要省电。而实现这些的核心,就是功率半导体的选型与配合。这篇文章我把这些年踩过的坑和总结的经验整理出来,涉及MOSFET、IGBT、快恢复二极管、薄膜电容、安规电容、熔断器、MCU和霍尔传感器,也会聊到华润微电子、宏微、法拉电子、威可特、BYD这些供应商的实际表现。希望对做高可靠性电源的同行有帮助。

服务器电源主流拓扑是:前级PFC(交错并联Boost) + 后级DC-DC(全桥LLC或移相全桥)。功率从几百瓦到3000瓦不等,输出电压12V或48V。
PFC级开关频率通常在65kHz-100kHz,这个频段MOSFET是绝对主力。我们最早用华润微电子的CRSM系列超结MOSFET(如CRSM650N65G2,650V/0.39Ω)。但有一款2400W电源在老化时PFCMOSFET温度偏高,用热成像仪测到125℃。分析发现,虽然Rds(on)只有0.39Ω,但开关损耗占了总损耗的40%。高频下,MOSFET的栅极电荷Qg和输出电容Coss对开关损耗影响很大。CRSM650N65G2的Qg是85nC,Coss是120pF。我们换了一款Qg只有45nC、Coss 65pF的MOSFET(同品牌另一系列),Rds(on)略大到0.45Ω,但总损耗降了28%,温度降到了98℃。
结论:MOSFET在高频PFC中,优先看Qg和Coss,Rds(on)只要不是太差就行。另外,MOSFET的体二极管反向恢复特性也很关键——在PFC的CCM模式下,体二极管会参与换流,如果Qrr太大,会产生额外的开通损耗。我们后来干脆在每个MOSFET外部并联了一个快恢复二极管(华润微电子的CRF06A65),虽然成本增加了一点,但效率提升了0.2%。
LLC级的原边开关管,输出电压12V时匝比大,原边电压400V左右,频率100kHz-200kHz。这个频段MOSFET依然是首选。但到了3000W以上,或者输出电压升到48V(电流相对小),有些设计会尝试用IGBT。我们试过宏微的MMG50T120P4(1200V/50A IGBT)在LLC原边,发现在100kHz下开关损耗太大,效率比MOSFET低了2%。所以服务器电源里,IGBT基本没有市场,还是MOSFET的天下。但IGBT在更大功率的UPS或者数据中心的三相整流中仍有应用,后面会说。
服务器电源对EMI和寿命要求极高,电容选型不能马虎。
早期服务器电源的PFC输出母线电容用铝电解,但铝电解在高温下寿命短(105℃下通常5000小时)。数据中心机房虽然空调给力,但电源内部局部温度可能达到85℃以上,铝电解几年就老化了。后来我们全面转向法拉电子的薄膜电容。以一款2000W电源为例,PFC输出450V,选用法拉电子C4AF系列(500V/120μF,纹波电流能力25A)。实测在满载下电容表面温度只有78℃,寿命可以到10年以上。而且薄膜电容的ESR极低,高频纹波吸收能力远好于铝电解。
但是薄膜电容也有坑:它的容值随温度变化是负温度系数(-200ppm/℃左右),而铝电解是正温度系数。在低温启动时,薄膜电容的容值会比常温下降几个百分点,这对环路稳定性有一点影响。我们在MCU(BYD BF7112)里做了温度补偿:根据NTC读取的电容温度,动态调整电压环的补偿参数,解决了低温下输出电压纹波增大的问题。
有一款电源在通过EN55032 Class B测试时,辐射发射在60MHz附近超标。查了很久,发现是输入端的X2安规电容(法拉电子ECQ系列,0.33μF)离共模电感太远,中间有10cm的PCB走线。这段走线形成了天线效应。我们把X电容挪到了共模电感的输入侧,紧贴着电感引脚,并且加宽了走线(2mm宽)。同时,在安规电容两端并联了一个1MΩ的放电电阻(符合安全要求)。整改后辐射余量达到8dB。经验:安规电容一定要紧靠输入端或共模电感,引线越短越好。
服务器电源次级整流(12V/100A以上)以前用快恢复二极管或肖特基,现在主流是同步整流(MOSFET)。但在一些辅助电源或低压差场景,快恢复二极管仍然在用。我们有一款800W的电源,辅助电源(15V/3A)用了快恢复二极管(BYD的MUR460)。这个二极管在高温下(85℃环境)反向恢复电流明显增大,导致开关管(MOSFET)开通损耗增加,辅助电源效率只有82%。
我们换了华润微电子的CRF08A65(650V/8A,trr=35ns),效率提升到了86%。同时,在快恢复二极管两端并联RC吸收(22Ω+220pF),进一步抑制了振铃。后来为了更高效率,直接改成了同步整流,用了一颗MOSFET代替二极管,效率到了90%。但快恢复二极管在成本敏感或者小功率场合仍然有优势。
服务器电源的输入侧必须有熔断器。我们有一批1500W电源在客户机房发生了炸机——PFCMOSFET短路,熔断器没有及时熔断,导致线路板烧毁。检查发现我们用的威可特T5A慢熔断熔断器(250V/5A),弧前I²t是3800 A²s,而PFCMOSFET的短路耐受I²t只有1200 A²s。熔断器的I²t太大了,MOSFET都炸成渣了它还没断。
我们改用了威可特的快速熔断器系列(SFK-6.3A,弧前I²t 950 A²s),同时把输入浪涌抑制电路(NTC+继电器)优化了一下,确保开机浪涌不超过800 A²s。改了之后做短路测试,熔断器在0.8ms熔断,MOSFET没有炸裂。教训:熔断器的I²t必须小于功率半导体的短路耐受I²t,同时要大于开机浪涌的I²t,这个区间要找好。
另外,威可特的熔断器在服务器电源中还有一个用处:输出短路保护。12V输出端我们加了一个80A的熔断器,防止负载短路时把PCB烧穿。这个熔断器选的是大电流快速型,响应很快。
现代服务器电源普遍采用数字控制,MCU(或DSP)读取霍尔传感器的电流信号,实现PFC和LLC的闭环控制。我们用的MCU是BYD的BF7112(Cortex-M4F,带HRPWM和高速ADC)。
电流检测我们用开环霍尔传感器(如ACS725,50A量程)。但它的温漂达到了±2% @ -40~85℃,直接影响电流环精度。我们在生产校准环节,将电源放在25℃环境下,给霍尔传感器通入0A、20A、40A三个点,记录ADC值,拟合出增益和零点。然后把这些系数写入MCU的EEPROM。运行时,MCU每100ms读取一次内部温度传感器,根据预先标定的温度系数(通过高低温箱实验得到)实时修正。最终电流检测误差在全温度范围控制在±1%以内,满足了服务器电源的精度要求。
数字控制的劣势是过流保护响应慢(ADC采样+软件比较至少几微秒)。我们利用BYD BF7112内部的高速模拟比较器,将霍尔传感器的输出直接连接到比较器输入端,参考电压由DAC设置。一旦电流超过阈值,比较器输出触发PWM的硬件刹车(Brake),响应时间小于300ns。这个硬件保护作为第一道防线,软件保护作为第二道。实测在输出短路时,硬件保护在200ns内关断所有MOSFET,电源没有损坏。
虽然服务器电源本身很少用IGBT,但数据中心的前端UPS和三相整流柜会用。有一个数据中心的400kVA UPS,用了宏微的IGBT模块(MMG300T120T6),运行两年后出现模块炸毁。我们拆解分析,发现栅极驱动电路的光耦老化,导致驱动电压从+15V/-8V变成了+13V/-5V。负压不足,米勒电容耦合使IGBT误导通,发生直通短路。
解决方案:把驱动光耦换成带DESAT检测的隔离驱动芯片(如TI的UCC21750),并且增加了栅极负压稳压电路(-8V由DC-DC模块产生,并加了TVS钳位)。同时,在MCU中增加了对驱动电压的监控(通过分压电阻采样),一旦检测到驱动电压异常立即封锁PWM并报警。改了之后同站点再没有出现类似故障。
这个案例提醒:IGBT的驱动负压和栅极电压质量至关重要,不能只依赖光耦的次级电源。
为了降低损耗,数据中心开始推进48V母线甚至更高电压。这要求功率半导体耐压从100V向200V-300V发展。我们最近在测试华润微电子的200V MOSFET(CRSM200N10,Rds(on)=8mΩ),用于48V/50A的降压变换器。同时,薄膜电容也在向更高电压、更小体积演进,法拉电子推出了针对48V系统的100V薄膜电容,比铝电解寿命长得多。另外,霍尔传感器也需要更高的带宽和精度,以应对MHz级别的开关频率。
答:并联外部快恢复二极管是为了分担体二极管的反向恢复损耗。但如果外部二极管的结电容太大,会增加额外的开关损耗。我们实测发现,当MOSFET本身的体二极管Qrr已经较小(<200nC)时,并联外部快恢复二极管带来的改善很小,反而因为寄生电容增加导致效率下降0.1%。所以建议只有在MOSFET体二极管较慢(Qrr>400nC)的情况下才考虑并联。
答:小容量(<500μf)可以,大容量(>1000μF)成本太高。目前主流做法是:DC-Link用薄膜电容(几十到几百μF),输出端(12V)用大容量铝电解或者聚合物电容(因为输出电压低,铝电解的耐压低、容值密度高)。这样兼顾了寿命和成本。
答:关键计算浪涌I²t和短路I²t。服务器电源的输入浪涌来自大电容充电,通常可以用NTC限制到较小的值(比如500 A²s)。而短路电流由MOSFET短路耐受能力决定(比如1000 A²s)。那么可以选择弧前I²t在700-900 A²s之间的熔断器。我们一般用威可特SFK系列,它的I²t有多个档位可选,配合软件仿真确定最优值。
答:要覆盖控制环路的带宽(通常5-10kHz)和电流纹波的频率(PWM频率的基波和二次谐波)。比如PWM频率100kHz,需要至少200kHz的传感器带宽才能准确采样电流纹波。我们用的ACS725带宽为200kHz,够用。如果做数字控制需要更高精度,可以选择闭环霍尔传感器(带宽可达500kHz),但成本高。
答:我们用了BF7112几年,没有出现大规模失效。但有一个小问题:某些批次的ADC参考电压初始精度偏差较大(±2%)。我们的解决办法是在生产时用外部精密电压源校准,将校准系数写入EEPROM。另外,MCU的电源脚必须加磁珠和10μF+0.1μF电容,否则容易受MOSFET开关噪声干扰导致ADC跳动。
答:同步整流驱动电路中的自举二极管需要高压快恢复二极管,通常选600V/1A,trr<50ns。我们常用BYD的BYV26C或者华润微电子的CRF01A60。注意这个二极管的恢复特性会影响自举电容的充电,如果trr太长,自举电压可能不足,导致上管MOSFET驱动电压偏低。建议选超快恢复型。
服务器电源和数据中心供电系统对功率半导体的要求,归结为三点:高效率、高密度、高可靠。MOSFET(华润微电子)是主力,IGBT(宏微)在前端三相整流中有用武之地;快恢复二极管作为辅助或续流不可或缺;薄膜电容(法拉电子)替代铝电解是趋势;安规电容的布局直接影响EMC;熔断器(威可特)的I²t匹配决定短路保护成败;霍尔传感器和MCU(BYD)的数字控制与硬件保护要协同设计。希望我这些年的经验能给大家一些参考。如果你们在服务器电源或其他高功率密度电源产品中遇到了功率半导体选型、散热、保护或EMC方面的问题,欢迎随时联系我们。我们可以协助进行损耗仿真、双脉冲测试、热成像分析以及熔断器匹配计算。联系时请告知功率等级、输入输出电压和拓扑结构,我们会尽快响应并提供技术支持。

邮箱:tommy@chengdufara.com

扫一扫,了解更多