smartctl 명령어 사용법

시스템 엔지니어, 리눅스 프로그래머라면 리눅스 시스템 운영상태에서 하드디스크의 장애로 인해서 곤란을 겪은 적이 있을 것입니다.

어쩌면 사소한 문제일수 있겠지만, 잘못하다가는 중요한 데이터를 모두 손실될 수 있는 엄청난 큰일이 발생할 수 있기 때문에 틈나는대로 디스크 점검이 필요합니다.

윈도우에서는 크리스탈 디스크인포(crystaldiskinfo)라는 툴을 이용해서 손쉽게 자신의 하드디스크를 점검해볼 수 있습니다.

하드디스크 수명 측정 크리스탈 디스크 인포(crystaldiskinfo) 최신버전

하지만, 리눅스에서는 어떤 방법으로 점검해야될지 궁금하시는 분들이 계실텐데요, 생각보다 어렵지 않습니다. 제가 그 방법에 대해서 설명드리겠습니다.

smartctl 명령어 사용법

1) 리눅스 쉘 환경에서 smartctl 명령어가 먹히지 않는다면, 설치해야됩니다. yum install smartmontools 명령어를 통해서 설치합니다.

smartctl

smartctl

2) 설치가 완료되고 난 후에는 자신의 디스크가 /dev/sdaX 라면 smartctl -a /dev/sda1 이런식으로 입력하면 사진처럼 디스크정보를 세부적으로 확인할 수 있습니다.
[ads-m1]
이보다 더 좋은 툴은 없을것이라 생각 됩니다.

3) 가장 중요한 화면인데요, 이곳에 보시면 ID#이라고 보입니다. 1 ~ 199 넘버까지 존재하는데, 가장 핵심은 Reallocated_Sector_Ct 입니다. 이 값이 중가하면 조만간 디스크 고장이 됩니다.

조금 더 세부적으로 설명을 드리겠습니다.

[ads-m2]

Raw_Read_Error_Rate
디스크 표면이로부터 데이터를 읽는 과정에서 문제가 있을때 읽기 오류율입니다. 정상적인 하드디스크라면 RAW_VALUE = 0 이 정상값입니다.

Spin_Up_Time
플레터 회전이 제로 rpm에서 최대 rpm에 도달하는데 걸리는 평균 시간

Start_Stop_Count
플레터가 회전하고 정지한 횟수

Reallocated_Sector_Ct
재할당된 섹터수 입니다. 문제가 생긴 섹터를 예비 섹터에 재할당한 것으로, 정상제품은 RAW_VALUE = 0 이 정상값입니다.

0 이외의 값이 표시되면 논리/물리 배드섹터가 생성되고 있다는 뜻입니다. 상태를 예의 주시해야 합니다. 교품 또는 하드디스크 교체를 고려해야합니다.

Seek_Error_Rate
탐색 오류율

Power_On_Hours
작동한 시간입니다. 전원이 들어온 시간이 길수록 RAW_VALUE 값은 커집니다

Spin_Retry_Count
최대rpm에 도달하기위해서 회전을 시도하는 횟수 (정상이라면 1번에 끝나야한다)

Power_Cycle_Count
전원 on/off 횟수

Power-Off_Retract_Count
헤드가 플레터(디스크)에서 벗어나는 횟수 (간단하게 parking 위치로 이동한 횟수)

Load_Cycle_Count
헤드가 플레터위로 진입한 횟수

Temperature_Celsius
하드디스크 온도

Reallocated_Event_Count
스페어영역으로 대체된 섹터로 부터 데이터를 읽어간 횟수

hardware ecc recovered
ECC 오류검출로 인하여 복구된 횟수

Current_Pending_Sector
불안정적인 섹터로 스페어영역 섹터로 remap을 준비중이거나 읽는 과정에 문제가 생긴 섹터 (준 배드섹터)

Offline_Uncorrectable
읽기/쓰기에 문제가 생긴 섹터, 즉 디스크 표면이 손상됨. (한마디로 배드섹터)

UDMA_CRC_Error_Count
하드디스크 인터페이스를 통해 데이타 전송과정에 발생한 CRC 오류 횟수

Multi_Zone_Error_Rate
섹터에 쓰기과정에 발생한 에러가 검출된 횟수

이상입니다.

그밖에 다른 명령어는 사용하지 않기 때문에 smartctl -a 만 잘 사용하면 문제 없을 것입니다.

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다