일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 1.10
- gpfs
- AMD
- top500
- Linux
- v1.9
- ubuntu
- 1.9
- GPU
- CUDA
- java
- HPFSS
- nvidia
- Docker
- version
- PFSS
- CPU
- Source
- Singularity
- HPCM
- LUSTRE
- rhel
- client
- infiniband
- SLURM
- hpcm패치
- build
- HPE
- Cray
- patch
- Today
- Total
목록분류 전체보기 (92)
HPE CRAY 자료 공유
1. 파일을 이용한 패키지명 확인- RHEL: rpm -qf /path/file- Ubuntu: dpkg -S /path/file[예제]sylee@ubuntu:~/local_repo$ dpkg -S /usr/bin/dpkg-scanpackagesdpkg-dev: /usr/bin/dpkg-scanpackage2. 설치된 패키지 확인- RHEL: rpm -qa | grep - Ubuntu: dpkg -l | grep [예제]sylee@ubuntu:~/local_repo$ dpkg -l | grep fortranii gfortran 4:9.3.0-1ubuntu2 amd64 GNU Fort..
아래의 환경에서 Cray Lustre Client 빌드 과정을 소개 한다. - OS: Ubuntu 20.04.6 LTS- Lustre Client: Cray Lustre 2.15.B15 1. 의존성 패키지 설치# apt update# apt install module-assistant libreadline-dev debhelper \ dpatch automake pkg-config libtool libyaml-dev libnl-genl-3-dev \ libselinux-dev libsnmp-dev bzip2 quilt \ linux-headers-$(uname -r) rsync libssl-dev libpython3-dev swig \ tk tk-dev bison tcl tcl-dev grap..
Ubuntu OS 사용 시 패키지 설치 과정에서 의존성 패키지가 버전 업그레이드 되면서 의존성이 깨지는 문제가 발생한다. 자동 업데이트 기능을 꺼서 의존성 패키지의 버전을 유지 하자 1. /etc/apt/apt.conf.d/10periodic 변경 전APT::Periodic::Update-Package-Lists "1"; APT::Periodic::Download-Upgradeable-Packages "0"; APT::Periodic::AutocleanInterval "0";변경 후APT::Periodic::Update-Package-Lists "0"; APT::Periodic::Download-Upgradeable-Packages "0"; APT::Periodic::AutocleanInterval "0..
일반 사용자 계정으로 rocminfo 명령 실행 시 오류 해결 방법 오류 내용[sylee@cray ~]$ rocminfo ROCk module is loaded Unable to open /dev/kfd read-write: Permission denied sylee is not member of "video" group, the default DRM access group. Users must be a member of the "video" group or another DRM access group in order for ROCm applications to run successfully.- 일반계정(예: sylee)으로 AMD GPU의 rocminfo 명령 실행 시 /dev/kfd 디바이스에 권한..
OS별 기본 Python 버전 정리RHEL 버전Python 버전비고Red Hat Enterprise Linux 6Python 2.6 Red Hat Enterprise Linux 7Python 2.7 Red Hat Enterprise Linux 8Python 3.6 Red Hat Enterprise Linux 9Python 3.9 SLES 버전Python 버전비고SUSE Linux Enterprise Server 15Python 3.6
1. Patch 11793 - HPCM 1.10: cfirmware updates1.1. 패치 정보 주소https://support.hpe.com/connect/s/softwaredetails?language=en_US&collectionId=MTX-2435e54955e04bfa 1.2. 패치 목록HPCM-1765 add FW flashing support for Cray XD2000 computesHPCM-2589 add support for iLO firmware upgrade via cfirmwareHPCM-5186 add new async_apis rpmHPCM-5225 python library needs requests-toolbelt 1.0.0HPCM-5297 asyncio_cmdb..
1. Patch 11778 - HPCM 1.9: XD2000 platform and remote support1.1. 패치 정보 주소https://support.hpe.com/connect/s/softwaredetails?language=en_US&collectionId=MTX-69f55e3aa8624d88 1.2. 패치 목록HPCM-2906 XD2000 support HPCM-2907 Cray XD2000 nodes have a special bmc to query HPCM-2908 table of Sensor Type to Rest URI HPCM-2909 parse HW collection to serial numbers HPCM-2925 use redfish to query for FRU..
1. Patch 11754 - HPCM 1.8: slingshot 2.0 monitoring / alerting update1.1. 패치 정보 주소https://support.hpe.com/connect/s/softwaredetails?language=en_US&collectionId=MTX-728d575ec0234330 1.2. 패치 목록HPCM-2237 slingshot BER dashboard does not have any data HPCM-2776 Slingshot Error Reporting - Handle single line message HPCM-2868 Redundant Kafka topic for slingshot_CrayFabricHealthTelemetry HPCM-2869 ..
HPCM GUI 접속 시 계정이 등록되지 않는 경우 아래와 같이 오류가 출력 된다. 'sylee' is not allowed to run HPC GUI(see /opt/clmgr/etc/admins on the management node) 관리 계정으로 /opt/clmgr/etc/admins 파일에 admin 노드에서 조회되는 OS 계정(예: sylee)을 등록 하면 된다. 단, 계정을 추가해도 시스템을 관리 할 수 있는 권한은 제한되고, 모니터링 만 가능 하다.
HPCM 노드들의 root 비밀번호 변경에 사용되는 cpasswd 사용방법을 설명 합니다. # /opt/sgi/sbin/cpasswd --help Usage: cpasswd [OPTION]... Options: --debug print debugging output -h, --help print usage and exit -N, --node=NODE change password for NODE --no-encrypt do not encrypt the password, it is already encrypted -q, --quiet only print errors ..