카테고리 없음

데이터 신뢰성 — 스마트팩토리의 숨겨진 과제

린코더 2026. 4. 19. 21:32

LEANCODER · SERIES 2 PROLOGUE

데이터 신뢰성 — 스마트팩토리의 숨겨진 과제

지금 제조업 현장에서는 스마트팩토리 도입이 빠르게 확산되고 있습니다.
도입 자체가 목표가 된 곳도 많습니다. 그런데 글로벌 조사 결과는 냉정합니다.

제조기업 임원의 92%가 스마트팩토리가 경쟁력에 필수라고 답했습니다.
그런데 실제로 데이터를 의사결정에 활용하는 기업은 29%에 불과합니다.

Deloitte, 2023 Global Manufacturing Competitiveness Index

제조기업의 88%가 스마트팩토리 이니셔티브를 시작했습니다.
그러나 80% 이상이 기대한 성과를 내지 못했습니다.

McKinsey, Smartening Up with Artificial Intelligence, 2023

Gartner는 AI 프로젝트의 60%가 데이터 품질 문제로 중단될 것이라고 경고합니다.
장애물 1위는 데이터 품질 — 응답 기업의 43%가 꼽았습니다.

Gartner, Top Strategic Technology Trends, 2024

숫자는 같은 방향을 가리킵니다. 데이터의 질이 문제입니다.

그렇다면 질문이 하나 바뀝니다.

"데이터 품질이 낮다" — 그런데 왜 낮은가?


Testing Lab에는 빠지지 않는 질문이 있습니다.

"이 측정값을 신뢰할 수 있는가?"

측정기가 교정되어 있는가. 측정 방법이 표준화되어 있는가.
같은 조건에서 반복 측정해도 같은 값이 나오는가.

이것을 체계적으로 검증하는 것이 MSA — 측정 시스템 분석(Measurement System Analysis)입니다.

AIAG MSA 4th Edition — Automotive Industry Action Group

그런데 스마트팩토리 현장에서는 이 질문이 빠집니다.
센서를 설치한다. 데이터를 수집한다. AI 모델을 만든다.
'이 센서가 올바른 값을 측정하고 있는가'는 당연한 것으로 넘어갑니다.


CASE — 건조로 온도 센서

공장 건조로(乾燥爐)에 온도 센서가 설치되어 있습니다.
공정 온도가 일정 범위를 벗어나면 불량이 납니다.
AI 모델은 1년간의 온도 데이터와 불량 이력으로 훈련했습니다.

그런데 센서 하나가 설치 초기부터 서서히 드리프트되고 있었습니다.
실제 온도보다 낮게 읽히는 방향으로, 조금씩, 매일.

모델은 그 값을 '정상'으로 학습했습니다.

1년 후 실제 온도가 허용 범위를 벗어났을 때 —
AI는 알람을 울리지 않았습니다.
학습한 '정상' 범위 안에 있었으니까요.

데이터를 더 많이 모아도, 더 정교하게 정제해도 이 문제는 해결되지 않습니다.
측정 시스템 자체에 문제가 있을 가능성을 먼저 확인해야 합니다.


측정 오차에는 두 종류가 있습니다.

랜덤 노이즈

값이 위아래로 흩어집니다.
데이터를 많이 모으면 평균으로 상쇄됩니다.
정제로 줄일 수 있습니다.

체계적 오류 (Systematic Error)

항상 같은 방향으로 틀립니다.
데이터를 아무리 정제해도 편향은 그대로입니다.
모델은 그 편향을 '정상'으로 학습합니다.

"측정 시스템이 틀리면,
데이터 정제는 의미가 없습니다."

Garbage in, Garbage out — 누구나 아는 말입니다.
그런데 무엇이 Garbage인지를 알려면,
데이터가 만들어지는 출발점부터 살펴볼 필요가 있습니다.


시즌 2에서는 이 질문을 코드와 함께 풀어갑니다.

  • 데이터 오류가 AI 결과에 어떤 영향을 주는지 — 숫자로 확인합니다.
  • 현장에서 데이터 오류가 어디서 생기는지 — 사례로 짚어봅니다.
  • AI를 올리기 전에 무엇을 먼저 확인해야 하는지 — 순서를 정리합니다.

현장 데이터의 신뢰성 — 측정 시스템부터 이상 감지까지 함께 살펴보는 시리즈입니다.

👉 다음 글: [#0] 스마트팩토리 데이터, 무엇을 놓치고 있는가

린코더 (LeanCoder)
— 현장어를 코드로