APP下载

基于处理器芯片结温的网络设备温度监控调整及过温保护设计

2020-12-17黄由立

科教导刊·电子版 2020年16期

黄由立

摘 要 本文介绍采用TMP411配合CPU处理器和外围系统实现对处理器芯片内核温度与网络设备内部温度的测控,及过温保护的研究和设计。设计并实现了整套系统电路,通过专业接口将TMP411与CPU及CPLD接口连接,实现监控处理芯片内核温度和设备内部温度,并通过连接必要数据通信线路和控制线路控制外部系统形成设备散热自动调控及过温自动保护系统。实现了在不同使用环境下,设备实时监控CPU处理器芯片内部核心的结温与设备内部空气温度,一旦温度高出就会自动报警并自动风扇调速加强散热,极端过温环境下能自动下电保护芯片及设备不受损坏的功能。

关键词 TMP411 MIPS多核处理器 CPLD 温度监控 过温保护

中图分类号:TN919文献标识码:A

0引言

随着技术发展,MIP多核处理器的芯片主频和性能不断提升,导致相应的芯片功耗也越来越高。使用处理器的网络设备用于多种不同的使用环境,容易出现在密闭机柜或散热不良情况下,出现设备内部空气过热问题,导致CPU芯片内部核心温度升得过高,超过芯片结温上限后会导致芯片烧毁。而CPU处理器损坏整套网络设备就瘫痪无法工作,市面上已经有多例的故障案例造成较高经济损失。此情况下部分设备设计选择用简单的定速风扇散热设计,风扇按照默认全速运行在常温下有如下问题:风扇噪声很大,超出国标的噪声标准而无法通过认证、功耗较大消耗较多资源不够绿色环保、在环境温度升高变化后的弹性保护不足。因此急需设计实现一套系统方案能实时监控芯片内核温度与设备内部温度,基于温度实现散热系统既能满足噪声认证要求也能自动调整加强保护弹性,极端情况下还能自动下电保护避免芯片及设备出现物理损伤,具有较高实际意义和市场经济价值。

1系统功能设计

温度采集和自动散热调整及下电保护装置是本文的重点研究内容。温度采集模块用于实时收集CPU处理器芯片内核温度和设备内部环境温度,配合外部控制电路实现基于温度的自动散热能力调整及过温自动下电保护功能。此功能需要解决如下问题:一个是需要满足噪声认证指标下的可自动调整的弹性散热方案;另一个是极端环境CPU温度过高的情况下避免CPU持续运行導致内部晶体管过温击穿烧坏的下电保护措施。

对于噪声认证标准,国标的噪声测试要求在25度的常温环境下不超过40dB,此时风扇并不需要以最高的能力散热,当CPU或设备内温度升高到一定阈值的情况下,才开启最高的散热能力。因此设计风扇有两个级别的散热能力:一种是低温低速,满足噪声指标并具有一定的散热能力;一种是高温高速,满足最高的散热指标。

对于CPU烧坏问题,直接的原因是CPU的温度过高,一般CPU给出的最高内核结温时105度,如果给予足够的散热能力CPU不至于烧毁,但是外部环境和散热系统可能会变化,比如风道被堵、风扇损坏、散热片未锁紧、导热硅脂老化失效等情况,不能只依靠被动散热,需要一套主动的过温保护方案,通过主动获取CPU DIE的温度,当温度达到一定阈值后对CPU进行下电保护。

综合以上功能,设计三个温度点,THERM_A,THERM_B和THERM_C,设置THERM_A

THERM_A:表示CPU温度稍高,需要提升风扇散热能力。

THERM_B:表示CPU温度过高,需要高温报警,提示用户。

THERM_C:表示CPU温度极高,超过CPU工作温度,需要下电保护。

系统功能设计如下:

(1)当CPU温度未达到THERM_A温度点,风扇低速运转,无任何提示,系统正常运行。

(2)当CPU温度超过THERM_A的时候,风扇自动切换高速运行,直到CPU温度降低到THERM_A度之后风扇才变为低速。

(3)当CPU温度达到THERM_B及以上的时候,设备发出一次高温警告,记录信息并提示客户,系统红灯告警。直到温度低于THERM_B温度的时候,才系统灯恢复绿色。

(4)当温度达到THERM_C的时候,过温保护,系统灯显示红色,切断CPU的电源,直到CPU温度降低到THERM_C-10度后才恢复上电,复位重启。

2系统选型设计

2.1温度检测器件选型

根据温度检测需求选择TMP411作为温度检测芯片。TMP411是德州仪器TI推出一款准确度在?℃范围内的远程结温传感器与本地温度传感器集成一体的器件,可用于同时监控CPU、微处理器中的热敏二极管数据及自身本地温度传感器数据。

TMP411使用二极管测温功能,测温原理是基于二极管对温度十分敏感的特性,温度的变化将改变二极管压降:温度上升时管压降减小;温度下降时管压降增加,同时二极管的温度和压降的线性度相当好,所以被用来进行测试要求精密的测温。其能在-40℃~+125℃的温度范围内稳定工作,可测量温度范围则可高达 150℃,标称温度精度是+-1度。该器件不仅具备可编程串联电阻抵消与二极管非理想性校正功能,而且支持标准 I2C/SM BUS 兼容的双线接口上操作设置可编程过温与欠温阈值,以及对外设计有可对设置的阈值超标报警引脚,可对潜在危险散热环境做出即时响应,灵活方便的实现温度监控和过温保护控制功能。

2.2系统硬件设计

系统硬件电路主要由CPU处理器,TPM411模块,CPLD模块,以及外围配合的风扇二级调速模块,DC-DC电源模块,复位模块,点灯控制模块组成,系统连接如图1所示。

CPU处理器模块的内置热敏二极管的管脚THERMAL_D+和THERMAL_D-连接TMP411的对应D+和D-管脚,利用二极管测温原理实现CPU处理器内核的温度检测。CPU模块通过I2C总线连接TMP411的SCL/SDA管脚作管理通道,实现对TMP411的初始化和设置,并可操作读取温度。I2C总线是OD门,需要1k到10k电阻上拉到3.3V,根据负载大小和信号实测调整确定。

TMP411模块的THERM_2#和THERM#为温度触发信号,分别对应设定温度THERM_A和THERM_C,THERM_A#表示超过设定的THERM_A温度点,用于控制风扇转速控制。THERM_C#表示超过设定的THERM_C温度点,用于CPU高温下电保护。这两个管脚为OD门需通过4.7K~10K电阻上拉到3.3V连接到CPLD模块。

CPLD模块与CPU之间用数据总线交互,用于传递各模块状态信息,可访问温度相关的寄存器,数据线位宽设计为4bit连接。为控制风扇噪声问题,CPLD通过风扇控制信号管脚连接风扇二级调速模块,实现风扇高速和低速调整切换,温度正常时风扇处于低速状态满足绿色环保噪声要求,温度超标再高速运行保证足够散热。CPLD的电源控制管脚连接到电源模块,用于实现CPU过温时必要的下电保护控制以及温度降低恢复后的重新上电操作。为了保护芯片不受异常下电动作的损坏,通过CPLD连接控制复位信号到复位模块,对整机复位电路进行控制,保护设备CPU及其他主要芯片。为了更加直观展示过温状态并提醒用户,因此连接CPLD与点灯模块,在警告期间和过温保护期间让系统指示灯显示红色,正常状态下显示绿灯。

3系统软件设计

3.1软件操作流程

见图2。

系统运行流程如下:

(1)设备上电启动并进入初始化,此时CPLD默认设置风扇高速运转。

(2)软件开始对TMP411温度寄存器进行预设及必要的初始化。

(3)设置过温温度阈值,开启过温保护功能,之后就进入硬件执行流程:当温度正常,保持正常工作。当CPU温度极高,进入过温保护状态,CPU的core电源关闭,复位信号被拉低,系统灯变成红色。直到温度低于THERM_C-10度的时候还原,CPU电源上电,芯片进入复位重启流程。

(4)设置风扇控制温度,设置后风扇控制由TMP411的硬件信号THERM_A#电平决定。THERM_A#=1,则风扇低速运转;THERM_A#=0,表示超过THERM_A设定温度,则风扇高速运转。

(5)主程序下开启定时器中断,通过定时软件轮询TMP411的寄存器:定时读取CPU温度,如果CPU温度高则串口打印高温报警,软件控制系统状态灯变成红色,低于则退出中断。

3.2实际应用测试

系统设置therm_A=60℃,therm_B=80℃,therm_C=100℃,实际对处理器进行加热模拟环境变化,验证风扇调速和保护结果:

(1)设备启动3~5s时间内风扇高速运转,然后低速运转

(2)设备运行过程中处理器结温温度<60℃,风扇低速运转

(3)当60℃<处理器结温温度<80℃,风扇高速运转

(4)当80℃<处理器结温温度<100℃,风扇高速运转,设备告警,系统灯亮红色

(5)当100℃<处理器结温温度,风扇高速运转,关闭处理电源,进入保護状态,处理温度降低后重新进入步骤1)重新启动。

实际验证确认该系统具备自动风扇调速,能良好保护处理器不被过温击穿。

4结论

处理器芯片主频和功耗不断提升,但芯片主要材质还是硅,无法承受高温。但是应用处理器的网络设备却需要适应高温的使用环境,同时还需要符合国标的相关认证标准。本文通过设计实现硬件平台电路配合软件系统实现基于处理器结温的网络设备自动散热调整和过温保护的功能。经验证结果表明网络设备使用本系统能完全符合国标认证噪声标准,同时具备良好的散热弹性调节,在极端情况能及时下电保护设备,满足设计要求,可以在许多场合进行广泛应用。

参考文献

[1]汤锴杰,栗灿,王迪等.基于DS18B20 的数字式温度采集报警系统设计[J].传感器与微系统,2014,33(03):99-102.

[2]牛刚.热电偶测温的原理与应用[J].华东科技:学术版,2012(12):3.

[3]罗继军.AltiumDesigner在PCB 板设计中的应用[J].科技展望,2016,26(29):117-118.

[4]潘晓妮.单片机温度检测控制系统[J].中国科技信息,2019(05):54-55.

[5]刘旭娟,梁嘉浩,孙涛,马欢港,陈壮.汽车车室智能温度检测与调控装置的设计[J].南方论坛,2019,7(01):44-67.

[6]范寒柏,谢汉华.基于NTC 热敏电阻的三种高精度测温系统研究[J].传感技术学报,2010,23(11):1576-1579.