일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- rhel
- java
- version
- patch
- ubuntu
- SLURM
- Source
- build
- 1.9
- Docker
- GPU
- v1.9
- gpfs
- Linux
- CUDA
- HPE
- Singularity
- nvidia
- 1.10
- CPU
- HPCM
- Cray
- infiniband
- PBS
- LUSTRE
- HPFSS
- client
- PFSS
- AMD
- hpcm패치
- Today
- Total
목록SYSTEMS (41)
HPE CRAY 자료 공유
2019년 IBS 기초과학연구원의 CRAY XC50 슈퍼컴퓨터 도입 이야기 - 출처: https://youtu.be/zjCe366pQwA?si=ND5cjw5NJhdZRjBe
- XD675 장비 정보구분내용비고CPUsAMD EPYC 4th Scalable Processors(Genoa) GPUs8x AMD MI300X OAM GPUs DimensionsHeight35.3cm(8U) Width44.7cm Depth80.0cm Weight300lbs(Maximum 약 136.1kg), 265lbs(Minimum 약 120.2kg) - 출처: https://www.hpe.com/dk/en/hpe-cray-xd675.html https://support.hpe.com/hpesc/public/docDisplay?docId=a50009207enw&docLocale=en_US https://support.hpe.com/connect/s/product?..
일반 사용자 계정으로 rocminfo 명령 실행 시 오류 해결 방법 오류 내용[sylee@cray ~]$ rocminfo ROCk module is loaded Unable to open /dev/kfd read-write: Permission denied sylee is not member of "video" group, the default DRM access group. Users must be a member of the "video" group or another DRM access group in order for ROCm applications to run successfully.- 일반계정(예: sylee)으로 AMD GPU의 rocminfo 명령 실행 시 /dev/kfd 디바이스에 권한..
1. Patch 11793 - HPCM 1.10: cfirmware updates1.1. 패치 정보 주소https://support.hpe.com/connect/s/softwaredetails?language=en_US&collectionId=MTX-2435e54955e04bfa 1.2. 패치 목록HPCM-1765 add FW flashing support for Cray XD2000 computesHPCM-2589 add support for iLO firmware upgrade via cfirmwareHPCM-5186 add new async_apis rpmHPCM-5225 python library needs requests-toolbelt 1.0.0HPCM-5297 asyncio_cmdb..
1. Patch 11778 - HPCM 1.9: XD2000 platform and remote support1.1. 패치 정보 주소https://support.hpe.com/connect/s/softwaredetails?language=en_US&collectionId=MTX-69f55e3aa8624d88 1.2. 패치 목록HPCM-2906 XD2000 support HPCM-2907 Cray XD2000 nodes have a special bmc to query HPCM-2908 table of Sensor Type to Rest URI HPCM-2909 parse HW collection to serial numbers HPCM-2925 use redfish to query for FRU..
1. Patch 11754 - HPCM 1.8: slingshot 2.0 monitoring / alerting update1.1. 패치 정보 주소https://support.hpe.com/connect/s/softwaredetails?language=en_US&collectionId=MTX-728d575ec0234330 1.2. 패치 목록HPCM-2237 slingshot BER dashboard does not have any data HPCM-2776 Slingshot Error Reporting - Handle single line message HPCM-2868 Redundant Kafka topic for slingshot_CrayFabricHealthTelemetry HPCM-2869 ..
HPCM GUI 접속 시 계정이 등록되지 않는 경우 아래와 같이 오류가 출력 된다. 'sylee' is not allowed to run HPC GUI(see /opt/clmgr/etc/admins on the management node) 관리 계정으로 /opt/clmgr/etc/admins 파일에 admin 노드에서 조회되는 OS 계정(예: sylee)을 등록 하면 된다. 단, 계정을 추가해도 시스템을 관리 할 수 있는 권한은 제한되고, 모니터링 만 가능 하다.
HPCM 노드들의 root 비밀번호 변경에 사용되는 cpasswd 사용방법을 설명 합니다. # /opt/sgi/sbin/cpasswd --help Usage: cpasswd [OPTION]... Options: --debug print debugging output -h, --help print usage and exit -N, --node=NODE change password for NODE --no-encrypt do not encrypt the password, it is already encrypted -q, --quiet only print errors ..
[제품 개요]HPE Cray 스토리지 시스템 C500은 오픈 소스 병렬 파일 시스템 아키텍처를 활용하여 뛰어난 성능을 제공하며 제한된 스토리지 예산으로 CPU/GPU 투자의 활용률을 개선하고자 하는 엔트리 및 미드레인지 HPC/AI 클러스 터에 적합합니다. 이 고유한 하이브리드 아키텍처는 여러 스토리지 미디어(NVMe, SSD/SAS, HDD)의 장점을 활용 하는 한편 각각의 약점도 피하여 소수의 랙 장치로 뛰어난 성능과 속도를 지원합니다. - HPE Support Center 제품 페이지: HPE Cray Storage Systems C500 | Product Support - SMU(System Management Unit): System management, Logging, and boot se..
allshow TV(2021.09.29)HPC 및 AI 시장 동향과 HPC 전용 HPE GPU 스토리지의 강점 및 필요성에 대해서 소개.슈퍼컴퓨팅, 클라우드, 데이터센터를 잇는 HPE Cray EX SupercomputerHPE Cray EX 시스템 레퍼런스를 통한 HPC 및 AI 시장 동향 - 출연: 한국 HPE HPC&AI 서동진, 김범수- 출처: allshow TV(youtube)