
会议主题:【20250528】hardware-sig组例会第七次例会 会议详情: hardware-sig组例会第七次例会,因下周一meetup冲突,时间调整到周三,请知悉。 发起人: changxingOpenUBMC 会议时间:2025-05-28 16:00-18:00 会议平台: WELINK 会议ID: 980376640 会议链接:https://meeting.huaweicloud.com:36443/#/j/980376640 Etherpad链接:https://etherpad.openubmc.cn/p/sig-hardware 【20250528】本次例会新增遗留问题: 1、支持基于openUBMC适配SATA SSD方案分析及解决计划; 2、OpenUBMC NCSI 规范对齐 & E810 NCSI 带外管理问题解决计划; 3、社区创建CSR字典详细描述每个类及属性的配置和含义计划; 4、联合交付需求详细设计评审流程; 5、各类板卡、器件告警列表如何在社区承载;ipmi接口规范如何承载在社区,进展咨询; 6、社区有材料承载电源升级流程指导; 7、下一次hardware-sig组件培训安排; 【议题1】上次例会遗留问题闭环审视:责任人:常德兴 1、hardware-sig组织新增固定与会人,需要在TC申报议题评审,后续也是部件厂商也需要加入; 结论:先以固定与会人运作,通过过程中的贡献,后续评估再加入Maintainer 2、规划的例行事务需要系统性、对伙伴有帮助,需要与伙伴讨论固定议题,先按已有议题运作,并后续组织会议讨论; 结论:先以固定议题(社区组件主要合入同步及问题单issue审视、hardware下各组件培训诉求收集、伙伴讲解组件的理解及诉求) 3、针对社区交付规则、开发流程、培训归档,确认当前是否有机制保证,后续怎么运作,归档路径确认,开发指导如何承载; 结论: 1、视频培训要在社区录制并上传到固定的B站社区; 2、培训材料归档到:https://discuss.openubmc.cn/tag/%E6%8C%87%E5%AF%BC%E6%96%87%E6%A1%A3; 3、交付件归档要等RM-sig确定; 4、收集伙伴兴趣组件,用于后续安排功能集建设和贡献; 结论:当前已反馈的伙伴如下: 王志杰 network_adapter 邱豪 storage和pcie_device 杨波 storage和pcie_device 黄宇轩 network_adapter 黄敏才 power_mgmt 刘杰 storage 欧阳勇刚 storage 和 network_adapter 王加凯 pcie_device network_adapter 5、下周pcie_device培训安排; 会议主题:pcie_device组件业务培训 会议详情: 讲解pcie_device组件相关业务,讲师:王祝炜 发起人: changxingOpenUBMC 会议时间:2025-05-30 11:00-12:00 会议平台: WELINK 会议ID: 962015316 会议链接:https://meeting.huaweicloud.com:36443/#/j/962015316 Etherpad链接:https://etherpad.openubmc.cn/p/sig-hardware 【议题2】议题名称:支持基于openUBMC适配SATA SSD 申报人: 黄宇轩 申报日期: 2025/5/27 涉及组件名: storage 议题背景:伙伴兼容性扩充过程中发现25.03版本openUBMC搭配博通raid卡的情况下,不支持获取Solidigm SATA SSD的厂商信息和磨损率,需要适配。但是开源组件中找不到相关的适配代码和指导。 评审点:支持openUBMC适配SATA SSD,并提供指导文档 【评审结论】: 1、穿刺平台提供新接口完成厂商数据注入,方案分析 --责任人:常德兴 2、先出联调版本验证可行性,通过PAE发布补丁; 【议题3】议题名称:OpenUBMC NCSI 规范对齐 & E810 NCSI 带外管理问题 申报人:邱豪、罗银 申报日期:2025/5/28 涉及组件名:network_adapter、mctpd、lib_protocol 议题背景:伙伴适配 Intel E810 网卡 NCSI 带外管理过程中发现 openUBMC NCSI 管理计算 payload length 的方法好像与 NCSI 规范不符,导致 Intel E810 芯片温度和光模块温度获取失败,如果确认是此问题的话需要社区推动在 Q2 版本前在MCTP逻辑修复并预留伙伴开发和测试时间。 评审点:社区确认 openUBMC NCSI payload 计算是否有问题,并提供解决方案。 【评审结论】: 1、630随平台SDK版本发布正式解决; 2、平台解决该BUG,PAE发布补丁解决,用于联调功能上库,计划确认 -- 责任人:常德兴; 【议题4】议题名称:GPU显卡适配芯片温度和功耗获取失败 申报人:邱豪、王志杰 申报日期:2025/5/28 涉及组件名:vpd 议题背景:适配gpu显卡时,温度和功耗获取失败,详情见社区帖子 https://discuss.openubmc.cn/t/topic/1111 评审点:1. 提供sr文件里每个属性的详细文档 2. 提供温度和功耗获取失败问题的解决方案 【评审结论】: 1、针对问题1,后续将在社区创建CSR字典详细描述每个类及属性的配置和含义; 【议题5】议题名称:支持管理网卡MCX75310AAS-HEAT详细设计评审 申报人: 黄宇轩 申报日期: 2025/5/28 涉及组件名: vpd 议题背景:伙伴兼容性扩充需求,某学院项目需求适配该网卡 评审点:详细设计是否完善,能否开始走代码上库流程https://gitcode.com/openUBMC/vpd/issues/50 【评审结论】: 1、详细归档和评审 -- 责任人:常德兴 【例行议题1】社区组件主要合入同步及问题单issue审视 【责任人】范滔、李东辉、毛宇浩、汪航、黄嘉培 (1)chassis: 需求-支持通用硬件满足资源树协作接口关键字规范要求 需求-资产清单接口新增Model属性 issue:无 (2)general_hardware: 需求-支持general_hardware满足资源协作接口关键字规范要求 issue 【问题单】bmc.kepler.Systems.Retimer接口下的TemperatureCelsius类型定义不一致"---2025/6/10 【问题单】支持一键收集导出板卡信息,mcu信息---2025/6/10 (3)storage: 需求-支持GetTelemetryData rpc方法 问题-修改PatrolState初值 需求-支持通用硬件满足资源树协作接口关键字规范要求 issue: 【问题单】ipmi命令设置存储配置里面大部分功能响应体误填多余数据-未处理-预期完成时间2025-6-10 【问题单】Raid控制器信息日志在无Raid卡情况下无法生成-----------未处理-预期完成时间2025-6-10 【问题单】双raid卡时概率 性有一张raid 卡 数据信息无法刷新成功----已回复,无修改 【问题单】ipmi接口SetPCHDiskInfo的硬盘厂商定义错误,不应该使用定制的厂商----2025/6/10 (4)network_adapter: 需求-资产清单接口新增Model属性 需求-NCSI边带管理能力新增paramter_init相关功能 需求-NCSI边带管理能力新增get link status相关功能 问题-prbs压测出现光模块SN重复 issue 【问题单】network_adapter.lua中update_port_mac_action函数代码拼写出现问题---2025/5/30 (5)thermal_mgmt 需求-支持一键日志收集风扇模式、调速模式 问题-修复SetSmartCoolingTargetTemperature中设置值大小比较错误 (6)power_mgmt 需求-支持升级指定电源原子能力 需求-支持电源升级校验原子能力 需求-支持电源授时能力 剩余issue具体见表格分析 (7)bios 1、需求-bmc支持对redfish下发的bios密码进行复杂度校验 https://gitcode.com/openUBMC/bios/pull/21 2、需求-支持bios启动项控制策略定制 https://gitcode.com/openUBMC/bios/pull/18 3、需求-支持异构算力子系统满足资源树协作接口关键字规范要求 https://gitcode.com/openUBMC/bios/pull/19 4、issue 问题-当前1.70.32版本bios仓 bmcgo gen后,BIOS组件起不来 导致iBMC回退 6/10 (8)pcie 1、支持获取pcie设备的classcode https://gitcode.com/openUBMC/pcie_device/pull/14 2、需求-支持异构算力子系统满足资源树协作接口关键字规范要求 3、issue 问题-os下电后,出现日志刷屏 6/10 (9)lsw 1、需求-支持异构算力子系统满足资源树协作接口关键字规范要求 2、issue 开源首版本编译不过 6/10 【例行议题2】hardware下各组件培训诉求收集及安排 已收集伙伴诉求讲解storage组件 【例行议题3】伙伴讲解组件的理解及诉求 邱豪:讲解pcie_device -- 下一次分享 杨波:讲解storage -- 下一次分享 黄宇轩:讲解network_adapter -- 已完成分享 黄敏才:讲解power_mgmt -- 已完成分享