⚙️

[원프학개론] 설비 예지보전의 첫 단계, Sensing (기초편)

원프학개론: 설비진단의 완전함을 리드하는 원프레딕트의 원천 기술 PHM (Prognostics and Health Management: 건전성 예측 및 관리) 강의 시리즈 이전 편을 읽고 오시면 이번 편을 더 즐기실 수 있습니다.

이번 편 부터는 PHM (Prognostics and Health Management: 건전성 예측 및 관리)기술을 구성하는 4가지 요소에 대한 강의 자료를 기반으로 구성됩니다. 각 주제 별 내용은 기초편 & 심화편으로 발행됩니다.

Intro

여러분이 살인 현장을 수사하는 형사라고 상상해 봅시다.

우리는 누가, 어떻게, 그리고 언제 그를 살해했는지 비밀을 풀어야 합니다. 가장 먼저 무얼 해야 할까요? 훈련된 전문 탐정으로서 먼저 시신에 남아있는 상흔이나 특징들을 찾고자 할 겁니다. 시신을 만져보며 경직도를 판단하거나 첨단 화학 장비를 이용할 수 있겠죠. 화학 약품이 사용되었다면 현장에서 특이한 냄새를 감지할 수 있을지도 모릅니다. 이처럼 현장의 진실을 밝혀내기 위해서는 다양한 감각을 총동원해야만 합니다.

자! 이제 여러분은 산업 기계를 조사하는 탐정입니다. 여러분은 PHM 전문가로서 산업의 다양한 설비가 작동하는 모습을 살펴보고, 다양한 징후들을 찾아 설비의 상태와 성능을 평가해야 합니다. 범죄 현장의 숙련된 탐정처럼, 여러분은 눈앞에 있는 설비들을 꼼꼼히 조사해 단서를 찾는 것으로 조사를 시작할 겁니다. 탐정이 시신의 흔적과 징후를 조사하는 것처럼 기계에 마모, 이상 또는 오작동의 흔적이 없는지 꼼꼼하게 검사해야 하고, 또 이 과정에서 여러 첨단 기술을 사용해 숨겨진 부분을 찾아내야 할 수도 있습니다.

이처럼 어떤 일이 일어났고 앞으로의 일을 이해하려면 우선적으로 대상 설비에서 다양하고 유용한 데이터를 수집하는 것이 중요한데요, 특히 PHM에서는 이 첫 번째 과정을 ‘Sensing (센싱)’이라고 합니다. 오늘은 PHM에서’ Sensing’의 전반적인 의미에 대해 알아보고, 심화편에서는 기술적으로 자세히 알아보도록 하겠습니다.

System Knowledge

우리는 산업 설비에서 어떤 종류의 데이터를 수집할 수 있을까요? 

PHM을 위해 필요한 데이터는 무엇일까요, 질문에 답하기 위해서는 목표로 하는 산업 설비의 ‘문제(고장 모드)’를 먼저 정의해야 합니다. 산업 현장에는 다양한 설비가 존재하고 설비 별 다양한 고장 모드가 발생할 수 있습니다. 우리가 대상하는 설비의 생애주기를 파악하기 위해 각 고장 모드의 빈도나 중요도와 발생 시, 치명도 등의 요소를 확인하는 과정이 필요합니다.

이러한 과정을 FMECA (Failure Modes, Effects and Criticality Analysis)라고 합니다. FMECA는 산업 설비를 구성하는 다양한 컴포넌트에서 발생 가능한 잠재적 고장 모드와 그 영향을 식별하고 분석하는 체계적인 방법론인데요, 현장에서 발생하는 고장 모드, 어떠한 고장이 비용 손실을 발생 시키는지, 고장을 예방하거나 유지보수하기 위해서 어떤 조치가 수행되고 있는지를 분석하게 됩니다. 궁극적으로 FMECA는 고장에 따른 비용과 수행되는 유지보수 행위를 고려하여 PHM 기술의 진단 우선순위를 결정하는 것을 목표로 합니다.

일반적으로 FMECA는 4가지 단계로 구성됩니다.

첫 단계, 조사 대상이 되는 설비 포함 전체 시스템을 정의하여 전체적인 흐름을 파악합니다.

이 과정에서는 시스템의 구조와 기능을 명확히 이해하기 위해 구체적인 설계도나 회로도, 운영 세부 사항을 검토할 수 있습니다. 다음 단계, 조사 진행의 기반을 구축하는 단계로 전체적인 시스템을 System (시스템) / Subsystem (서브시스템) / Unit (유닛)으로 나누고 각 구성 요소를 명확히 하여 복잡한 시스템을 파악 가능한 수준으로 정의하는 것이 첫 단계의 핵심입니다.

기차는 현대인들의 삶 속에서 쉽게 마주할 수 있는 대표적인 산업 설비입니다. 기차는 어떤 설비요소로 구성되어 있을까요? 기차라는 전체 시스템을 각각 시스템 / 서브시스템 / 유닛으로 분해해봅시다.

두 번째 단계로는 각 시스템의 작동 원리를 이해해야 합니다.

이때 기능을 설명하는 다이어그램을 사용하여 시스템 / 서브 시스템 / 유닛 간의 상호관계 및 종속성을 표현하면 보다 명확하게 파악이 가능한데요, 특히 유닛 간의 상호 영향을 바탕으로 쉽게 드러나지 않았던 고장 모드의 원인 등 다양한 정보를 얻을 수 있습니다.

이렇게 각 시스템 간 상호작용의 이해를 바탕으로 고장이 발생할 수 있는 잠재적인 주요 타겟 영역을 정의할 수 있다는 점이 다이어그램의 가장 중요한 핵심입니다.

브레이크 시스템은 기차를 구성하는 중요한 시스템 중 하나입니다. 브레이크 시스템을 구성하는 다양한 서브시스템과 유닛들은 서로 유기적으로 상호관계를 맺고 있습니다. 이렇게 파악된 요소간의 관계는 브레이크 시스템의 고장과 관련된 다양한 인사이트를 제공합니다.

이제 시스템이 어떻게 작동하는지 이해했으니 세 번째 단계에서는 좀 더 깊게 파고들어 시스템의 각 요소에서 어떤 고장이 발생할 수 있는지 알아볼 단계입니다.

이 단계에서는 각 서브 시스템 / 유닛 별 어떠한 고장 모드가 몇 회 빈도로 발생하는지 식별해야 하는데요, 특히 고장 발생 가능성과 유형을 구분하는 것이 중요합니다.

하나의 서브 시스템 / 유닛에서도 다양한 고장 모드가 발생할 수 있습니다. 이 단계에서는 발생 가능한 고장 모드를 포괄적으로 파악해서 고장이 발생할 가능성이 가장 높은 서브 시스템 / 유닛을 발견하여 선별하는 것이 핵심입니다.

에어컴프레서와 솔레노이드 밸브라는 두 가지 대표 유닛을 살펴봅시다. 솔레노이드 밸브는 에어컴프레서에 비해 거의 세배정도 더 많이 고장이 발생했네요. 그 원인도 다양하고 고장 모드도 비교적 심각해 보입니다. 만약 제한된 리소스로 PHM 기술을 개발해야 한다면 에어컴프레서보다 솔레노이드 밸브를 대상으로 개발하는 것이 우선될 것 같네요.

이전 단계에서 얻은 인사이트를 바탕으로 마지막 단계에서는 선별된 서브 시스템 / 유닛에 대한 구체적인 고장 모드와 심각도, 중요도를 조사해야 합니다.

단일 서브 시스템 / 유닛에서도 다양한 고장 모드가 존재하기 때문에 각 고장 모드 별로 세분화하여 구분하는 것이 필요한데요, 해당 고장모드 별 심각도를 바탕으로 시스템 전체 기능에 미칠 수 있는 잠재적인 영향을 평가해야 합니다. 최종적으로는 각 고장 모드의 우선순위를 정하고 원인을 파악하여 이를 가장 잘 표현할 수 있는 데이터를 정의하는 것이 이 단계의 최종적인 목표라고 볼 수 있습니다.

솔레노이드 밸브의 다양한 고장에 대한 상세 분석입니다. 여기서 가장 치명적인 결함은 무엇일까요? 어떤 신호(signals)를 사용하여 PHM 기술을 개발할 때 가장 높은 효율을 보일까요?

지금까지 저희는 FMECA의 4가지 단계를 살펴보았습니다.

FMECA와 같은 체계적인 프로세스를 통해 설비의 시스템을 이해하고 고장 모드와 우선순위를 선별했으며, 이를 잘 표현할 수 있는 데이터를 정의할 수 있습니다. FMECA는 시스템의 기능적인 이해를 바탕으로 문제를 정확히 파악할 수 있고, 현장의 사례를 기반으로 하기 때문에 고객의 효용과 직접적으로 연결됩니다.

자, 이제 우리는 산업 설비에 대한 PHM 문제를 올바르게 정의하였습니다. 이제 구체적으로 이 문제를 풀기 위해 본격적으로 데이터를 ‘Sensing’ 해볼 차례입니다.

IoT (Internet of Things) for Sensing

IoT는 간단히 정의하면 인터넷 통신을 통해 다른 장치 및 시스템과 연결되어 데이터를 교환할 수 있는 하드웨어 장치를 의미합니다.

Sensing을 위해서는 다양한 종류의 IoT 디바이스가 필요한데요, 대표적으로 Sensor, DAQ, Gateway, Edge-Computer, 서버 / 클라우드 인프라 등이 포함됩니다.

이번 섹션에서는 각 IoT 디바이스들의 개념을 살펴보고, Sensing 과정에서 어떤 역할을 수행하는지 알아보고자 합니다. 각 디바이스에 대한 자세한 내용은 심화편에서 상세히 다뤄보도록 하겠습니다.

Sensor

Sensor (센서)는 데이터를 확보하기 위한 필수적인 장비로 물리적인 현상을 전기 신호로 변환하여 크기와 형태를 정확히 측정하는 장비인데요, 사람으로 비유하면 손이나 코와 같이 직접적으로 감각하기 위한 장비입니다.

센서를 선택할 때는 다양한 요소를 고려해야 하는데 대표적으로 감지된 신호를 Sensing 시스템과 통신하기 위해 유선으로 혹은 무선으로 연결할지 여부 등이 있습니다. 또한 원하는 샘플링 주기, 주파수, 감도 및 작동 온도와 같은 데이터를 감지하는 사양에 대한 고려도 필요합니다.

그 외에도 센서가 설치되는 장소의 실내 / 외 여부나, 센서의 부착 방식이 고정식 또는 이동식인지, 센서가 설치되는 환경이 건조한지 혹은 습도가 높은 환경인지 센서 작동 조건에 대한 고려도 빠질 수 없습니다. 이러한 요소를 모두 신중하게 고려한 후에는 측정해야 하는 물리적 특성과 설치 대상 설비에 따라 적합한 센서를 선택할 수 있습니다.

대표적인 센서의 종류입니다. 이외에도 세상에는 다양한 센서가 존재하고, 이 순간에도 끊임없이 새로운 센서가 개발되고 있습니다.

센서에는 측정 대상에 따라 크게 두 가지 유형으로 구분할 수 있는데요, 바로 포인트 센서와 분산 센서입니다.

먼저 포인트 센서는 점으로 간주할 수 있을 정도로 작은 영역을 측정하는 센서입니다. 이러한 센서는 시스템 또는 환경 내의 특정 위치 또는 지점에서 데이터를 측정하는데요, 일반적으로 특정 지점에서 정밀한 측정이 필요할 때 사용됩니다. 표면의 진동을 측정하는 진동 센서나 설비에 가해지는 텐션을 측정하기 위한 스트레인 게이지가 포인트 센서의 좋은 예입니다.

반면 분산 센서는 보다 넓은 포인트 센서와 달리 더 넓은 영역이나 지역을 측정하는데요. 주로 영역에 걸친 전반적인 특성이나 변화에 대한 정보가 필요할 때 자주 사용됩니다. 대표적으로는 의료 분야의 MRI나 적외선 카메라와 같은 비전 센서가 분산 센서에 해당합니다.

PHM에 사용되는 센서는 크게 포인트 센서와 분산 센서로 나눌 수 있습니다.

DAQ (Data acquisition, 전류 신호 수집 및 처리 장치)

데이터 수집(DAQ) 시스템은 일반적으로 신호 컨디셔너와 DAQ 하드웨어의 조합을 의미합니다. 신호 컨디셔너는 센서의 출력 전압을 증폭하거나 원치 않는 노이즈를 필터링하는 구성 요소로 획득한 신호가 추가 처리 및 분석에 적합한지 확인하는 장비입니다. DAQ 하드웨어는 센서 또는 신호 컨디셔너에서 출력된 전압을 컴퓨터에서 처리 가능한 디지털 신호로 변환하는 장비를 말합니다. 일반적으로는 이 두 장비를 함께 DAQ라고 통칭합니다.

DAQ는 컴퓨터에서 처리 가능한 디지털 신호로 변환한다고 설명해 드렸는데요, 이 과정에서 핵심 기능인 아날로그 - 디지털 변환(ADC)에 대해 좀 더 자세히 알아보도록 하겠습니다.

일반적으로 센서에서 변환된 전압 신호는 연속된 아날로그 신호의 형태로 DAQ에 전달되는데요, 컴퓨터가 신호를 처리하기 위해서는 비연속적인 디지털 신호로 변환하며 이 과정을 ADC라고 합니다. 분해능은 ADC과정에서 가장 중요한 요소로, 아날로그 값을 디지털 신호로 변환할 때 얼마나 정밀하게 분해하는지를 의미합니다. 일반적으로 ADC의 비트(bit) 수가 많을수록 분해능이 향상됩니다. 분해능이 향상되면 디지털 영역에서 아날로그 신호를 더 정확하고 세밀하게 표현할 수 있습니다. 예를 들어 아날로그 입력 범위가 0~10V인 경우 1비트 ADC는 이를 0V 또는 5V와 같은 두 개의 값으로 나누지만, 3비트 ADC는 이를 0V, 1.25V, 2.5V, 3.75V, 5V, 6.25V, 7.5V, 8.75V와 같이 8개의 값으로 나눌 수 있습니다.

최대 분해능으로 신호를 수집하려면 입력 신호의 범위에 따라 ADC의 사용 범위를 적절히 설정하는 것이 중요합니다. 예를 들어, ADC의 입력 범위가 다르면 분해능 차이가 발생합니다. 한번 아래의 두 가지 사례를 살펴볼까요?

Case 1은 0~10V 아날로그 입력에 3비트 ADC를 사용하는 경우이고, Case 2는 -10~10V 아날로그 입력에 동일한 3비트 ADC를 사용하는 경우입니다. 실제 계측되는 신호의 크기를 고려할 때 Case 1이 보다 적절한 입력 범위를 선택했다고 볼 수 있습니다. 이처럼 신호의 크기를 고려하여 입력 범위를 조정하면 아날로그 신호를 디지털 값으로 정확하게 변환할 수 있는 최적의 분해능을 확보할 수 있습니다.

DAQ가 디지털신호를 변환할 때, 올바른 분해능을 확보하는 것은 몹시 중요합니다.

Gateway

게이트웨이는 서로 다른 네트워크 간의 가교 역할을 하는 장치로, 센서(및 DAQ)를 통해 수집된 데이터와 서버 간의 통신을 담당하는 장비입니다. 센서에서 데이터를 전송하는 방법에는 여러 가지가 있지만, 일반적으로 모든 센서가 데이터를 서버로 직접 전송할 수 있는 것은 아닙니다. 이러한 경우 게이트웨이는 센서가 서버 통신에 적합한 프로토콜을 사용하여 데이터를 서버 또는 클라우드로 전송해 주는 일종의 메신저의 역할을 수행합니다.

만약 측정 대상이 많거나 서버와의 거리가 먼 경우에는 마찬가지로 여러 대의 게이트웨이를 설치해야 할 수 있습니다. 이 경우에는 데이터 송수신을 위한 네트워크의 병목으로 인해 데이터가 전체적인 게이트웨이의 전송 속도가 느려질 수 있다는 점을 고려해야 합니다. 따라서 게이트웨이의 구성을 설계할 때는 송수신되는 데이터의 양과 채널을 신중하게 고려해야 합니다.

게이트웨이는 다양한 설비로부터 들어오는 데이터를 PC나 서버와 같은 연산장치로 전달해주는 중계자의 역할을 수행합니다.

Edge Computing

Edge-Computer는 측정된 데이터를 중앙 서버나 클라우드로 보내 처리하는 대신 데이터가 생성되는 위치 또는 현장 근처에서 데이터를 실시간으로 처리하기 위한 분산 처리 시스템을 말합니다. 엣지 컴퓨팅을 구현, 데이터가 중앙 서버까지 장거리 이동하지 않아도 되기 때문에 데이터 송수신에서 발생하는 네트워크 트래픽을 줄일 수 있고, 데이터를 빠르게 처리해 전체 운영 효율성을 높일 수 있다는 장점이 있습니다.

또한, 엣지에서 실시간 데이터 분석 및 결과 도출이 가능하고 연산을 위한 리소스를 분배할 수 있기 때문에 중앙 서버에 대한 연결이 중단되어도 주요 프로세스는 여전히 작동이 가능해지고, 따라서 높은 가용성을 확보할 수 있습니다.

반면, 엣지 컴퓨팅은 분명한 단점도 존재합니다. 무엇보다도 먼저 비용이 증가할 수 있습니다. 엣지 컴퓨팅을 위해서는 연산이 가능한 엣지 디바이스의 추가 구매가 필요하고 시스템 구축에 더 높은 비용이 발생할 수 있습니다.

설치되는 디바이스가 증가한다는 것은 결국 관리 포인트가 증가하는 것을 의미하므로 유지보수 비용도 함께 증가합니다. 따라서 엣지 컴퓨팅 시스템을 구축할 때는 비용 효율성을 반드시 고민해야 하고, 필요에 따라서는 엣지 컴퓨팅을 선택적으로 구현하는 등 시스템을 최적화하는 과정이 수반되어야 합니다.

최근 컴퓨터 기술의 발전을 통해 엣지 컴퓨팅의 성능이 계속해서 증가하고 있으며, 이러한 분산된 연산을 통해 높은 가용성을 확보할 수 있습니다.

Server: On-Premise & Cloud

마지막으로 서버는 수집된 데이터를 관리/처리하기 위한 다양한 기능을 수행하는 장비입니다. 서버는 데이터를 저장할 뿐만 아니라 데이터베이스(DB) 내에서 데이터를 처리하기 위한 기능을 제공합니다. 또, 수집된 데이터를 분석하고 분석된 결과를 사용자에게 보여주기 위한 시각화 솔루션을 구현하기도 합니다. 이처럼 서버는 발생 가능한 다양한 연산을 처리하는 중앙 처리 장비이며, 서버를 구축하는 방법에는 온프레미스와 클라우드 두 가지가 있습니다.

온프레미스 서버는 서버 장비가 고객의 자체 전산실 내에 물리적으로 설치되고 운영되는 방식을 의미합니다. 이 방식은 사용자가 물리적으로 서버를 직접 구축 / 관리하기 때문에 고객이 필요로 하는 요구사항에 맞게 서버의 성능과 설정을 조정할 수 있습니다. 하지만 온프레미스 서버는 인프라 구축과 이를 관리하는 측면에서 상당한 투자가 필요하고, 이 과정에서 하드웨어의 감가상각이 발생할 수 있습니다.

반면, 클라우드 서버는 온프레미스의 높은 투자 비용과 구축 난이도를 우회할 수 있는 대안으로 최근 각광받고 있는 방식입니다. 클라우드 서버는 인터넷에 연결된 컴퓨터를 통해 데이터 스토리지 및 컴퓨팅 성능을 포함한 시스템 리소스에 접근하는 방식으로 사용자의 요구 사항에 따라 리소스 할당을 조정할 수 있습니다. 또한 사용자가 직접 관리할 필요 없이 원격으로 리소스에 접근/활용할 수 있으므로 유연한 대응이 가능합니다. 하지만 클라우드 서버는 인터넷 연결에 의존하기 때문에 네트워크 또는 서비스 제공업체에 문제가 있는 경우 리소스에 대한 액세스에 영향을 줄 수 있다는 단점이 있습니다.

따라서 서버의 제공 방식을 선택할 때는 클라우드와 온프레미스 방식의 장단점을 고려하여 예산, 제어 요구 사항, 확장성 요구 사항, 조직의 전반적인 IT 전략 등의 요인에 따라 결정되어야 합니다.

Conclusion

오늘은 Sensing 시스템의 전반적인 구성 요소와 각 구성 요소를 구축하기 위한 다양한 고려사항에 대해 알아보았습니다. 요약해 보면, 결국 Sensing 시스템을 구축하는 출발점은 사용자의 관점에서 사용자의 요구와 이점에 대한 이해이며, 이를 위해 반드시 FMECA가 선행되어야 합니다. 그다음 대상으로 하는 설비와 현장 상황을 고려해 Sensing 시스템을 구성하는 각 요소 들을 구체화해야 합니다.

효과적인 Sensing 시스템을 구축하기 위해서는 대상 산업 설비에 대한 광범위한 연구가 필요하고, 시스템을 구성하는 다양한 요소 별로 신중한 의사결정이 필요합니다. 결국 Sensing 시스템을 구축하는 것은 많은 하드웨어 구축 / 유지 비용과 직결되기 때문에 과도한 엔지니어링을 피하고 고객이 느낄 수 있는 효용가치와 요구 사항을 기반으로 시스템을 최적화하는 것이 중요합니다. 반면, Sensing 시스템은 PHM의 기초를 형성하며, 구축된 Sensing 시스템에서 수집된 데이터의 품질이 전반적인 PHM 기술의 품질을 좌우하기 때문에 충분히 신뢰할 수 있는 수준의 시스템을 구축하는 것 역시 중요합니다. 따라서 과도한 엔지니어링을 피하면서 양질의 데이터를 수집하기 위해 충분한 엔지니어링을 확보하기 위한 적절한 균형을 찾는 것이 Sensing 시스템 구축의 핵심이라고 볼 수 있습니다.

다음 포스팅에서는 수집된 데이터를 바탕으로 정보를 처리해 나가는 PHM의 두 번째 단계, ‘특성인자 추출’에 대해 살펴보도록 하겠습니다. 많은 기대 부탁드립니다.

본 포스트는 ONEPREDICT CEO 윤병동 교수의 수업자료를 바탕으로 ONEPREDICT 경험에 빗대어 재구성된 자료입니다.

이 글을 쓴 사람

김 수 호 | PdX팀

행동보다 말이 앞서는 INTP Project Lead 입니다

세상의 수많은 정보 속에서 길을 잃지 않기 위해 노력하고 있습니다.