SYSTEMS/HPCM

[Patch] HPCM 1.9 패치 목록

CRAY KOREA Blog 2024. 6. 3. 13:34

 

1. Patch 11778 - HPCM 1.9: XD2000 platform and remote support

1.1. 패치 정보 주소

https://support.hpe.com/connect/s/softwaredetails?language=en_US&collectionId=MTX-69f55e3aa8624d88

 

1.2. 패치 목록

HPCM-2906  XD2000 support
HPCM-2907  Cray XD2000 nodes have a special bmc to query
HPCM-2908  table of Sensor Type to Rest URI
HPCM-2909  parse HW collection to serial numbers
HPCM-2925  use redfish to query for FRU components
HPCM-3401  redfish event subscription for XD2000 systems
HPCM-3402  create service delivery information (SDI) for Cray XD2000 remote support use
HPCM-3550  redfish events from XD2000 bmc to kafka
HPCM-3564  send desired events from kafka to on premise client
HPCM-3565  provide Enriched Payload
HPCM-3709  kafka-msg-processor plugin system
HPCM-3749  build sgi-ta with python 39
HPCM-3811  add XD 2000 subscriptions to subsmon
HPCM-3956  receive xd2000 subscriptions
HPCM-3957  set up topic for enriched data
HPCM-3958  set up initial structure of enrichment plugin
HPCM-3959  populate Chassis/Subsystem
HPCM-3960  populate MessageId
HPCM-3961  populate device section
HPCM-3962  populate metadata section
HPCM-4054  populate originOfCondition
HPCM-4173  redfish MessageId and EventId workarounds
HPCM-4370  collect disk info for XD2000
HPCM-4381  XD2000 issues from demo
HPCM-4705  bad schema value for alerts
HPCM-4714  Auth and logging
HPCM-4780  parameter mismatch between 1.9 and 1.10 lib code
HPCM-4796  fru inventory not reporting XD2000 part number
HPCM-4821  Systems/Self/PartNumber required but not present in fru inventory
HPCM-4823  productid in enhanced message needs to be PartNumber not SKU

 

2. Patch 11779 - HPCM 1.9: monitoring, config manager and other updates #1

2.1. 패치 정보 주소

https://support.hpe.com/connect/s/softwaredetails?language=en_US&collectionId=MTX-07061d1a40544c42

 

2.2. 패치 목록

HPCM-3318  Add a new field called "job_nodes" into pbs_jobs kafka topic/elk index
HPCM-3736  alerta environment variable for IML alerts (host) has been appended as bytes ('b) and causing the device-level alerts invisible
HPCM-3776  Optimization of PBS mon script
HPCM-3806  Update HPCM 1.9 release notes and other documentation
HPCM-3983  slingshot-ama-service unable to set AMA
HPCM-4038  Convert PDU dashboard in Grafana to Timescale
HPCM-4056  VCDU not being collected
HPCM-4063  cover all the alert groups in mail_config.yaml
HPCM-4068  Add AMAs to the db for any AMAs previously discovered by lldp
HPCM-4078  remove remaining grafana dashboards based on elasticsearch
HPCM-4086  Use alternative mechanism to get the AMA in slingshot-ama
HPCM-4100  Trigger AMA to start on HSN link coming up
HPCM-4104  Regression: SLURM NODES Grafana dashboard is unable to update "Duration of slurm Node: None in ALLOCATED/IDLE state."
HPCM-4106  Slurm grafana dashboards produce query errors and visualizations with the newest version of grafana
HPCM-4117  verification of all Grafana dashboards by visualization and query
HPCM-4132  cmdb: nic operations put_all options for check_duplicate_mac, check_duplicate_ip, and compute_next_ip
HPCM-4133  Multiple nodes select for system monitoring timescale show no graph
HPCM-4157  Error Handling when euser and egroup details are absent
HPCM-4192  hpe_clmgr_power_api: Provide API to get all node power
HPCM-4194  cm-slingshot: Log by unique id (e.g. pid) and display time elapsed
HPCM-4200  Port handled corner cases on slurm monitoring from JT/SC system
HPCM-4201  Config manager can take too long
HPCM-4202  cm-slingshot should be more clearly defined as an HPCM package
HPCM-4207  PCIM configuration may take up to 5 minutes on large systems
HPCM-4226  hostnames in Heartbeat appended with bytes mark ('b) and troubles the node level alerts in alerta
HPCM-4233  remove event[original] fields from OS indices which are being populated via logstash
HPCM-4239  A node with a bmc-if IP can cause clmgr-power to pick this IP instead of its bmc IP
HPCM-4260  Fabric dashboard improvement
HPCM-4348  slurm_install_path and pbs_install_path parameter is missing in remlog-collect polling
HPCM-4383  Remove cdu and pdu ELK dashboard as well and move to ELK-OLD
HPCM-4414  Slingshot health check dashboard has no data (slingshot alerts)
HPCM-4428  Exception/Error when running many update configs
HPCM-4463  slurm dashboards not showing node and job power data
HPCM-4464  fixes for various issues identified slurm monitoring
HPCM-4495  CDU Monitoring Timescaledb dashboard for Apollo9K is missing
HPCM-4512  cmcinventory: monitor_mode hangs
HPCM-4524  Add SPANK power plugin support for slurm 23.x version
HPCM-4525  RDHX dashbboard's Input/Outlet Air Temp and Input/Output Water Temp shows empty panels
HPCM-4533  ARCS metrics are not shown with simulated data

 

3. Patch 11790 - HPCM 1.9: timescaledb performance improvements

3.1. 패치 정보 주소

https://support.hpe.com/connect/s/softwaredetails?language=en_US&collectionId=MTX-a4f06de6be6d466c

3.2. 패치 목록

HPCM-3952  Custom Compression and Retention Jobs for Timescale
HPCM-4588  Upgrade to Timescale 2.11.x
HPCM-4777  Adjust Default Connector Configs Based on Frontier Testing
HPCM-4860  Timescale Query Performances Improvements
HPCM-4881  Modify kfka-dist-setup to set task.shutdown.graceful.timeout.ms

 

4. Patch 11792- HPCM 1.9: clusterhealth, cm-cli updates for Slingshot 2.1 support

4.1. 패치 정보 주소

https://support.hpe.com/connect/s/softwaredetails?language=en_US&collectionId=MTX-6357e41e92d943be

4.2. 패치 목록

HPCM-5025  cm monitoring slingshot set -c config not working