서 론
정도관리(quality control, QC)는 환자 관련 결정(patient decision making)을 하는 데 있어서 중요한 정보를 제공하는 진단검사의학과 검사에 필수적인 요소이다[
1]. 정도관리는 검사실 분석 과정에서 오류를 검출 및 개선하는 목적을 가지고 있으며, 크게 외부정도관리(external QC)와 내부정도관리(internal QC)로 분류되어 시행하게 된다[
1]. 외부정도관리는 동일한 검체를 다수의 검사기관에서 측정하여 검사 장비 또는 측정 방법에 따라 발생하는 측정값의 차이(bias)를 최소화하여 검사의 정확도를 유지하기 위하여 분기별로 실시한다. 반면 내부정도관리는 매일 또는 수시로 시행하여 검사 과정에서 발생할 수 있는 오류를 미연에 방지하고 검사 측정치의 일관성을 확보하고자 하는 목적으로 실시한다[
1].
Sigma metrics는 검사의 성능을 객관적이면서 정량적으로 평가하기 위해 고안된 방법으로 총 허용오차, 바이어스%, 변이계수와 같은 검사의 성능 평가법에 이용되는 세 가지 항목을 가지고 계산하는 방법이다[
2]. Westgard가 제안한 sigma metrics를 통해 각 검사항목마다의 sigma value를 계산하며, 값에 따라서 검사실의 내부정도관리에 필요한 관리 물질의 개수와 rule의 기준을 정한다[
3]. Sigma value는 검사에서 error 발생률을 추정하는 수치이며 100만 건당 얼마나 error가 발생하는지를 의미하는 defects per million (DPM)에 따라 0에서 6까지의 sigma value로 표현된다[
4]. Sigma value에 따른 DPM은
Table 1과 같다.
Table 1에 따르면 Sigma value가 6이면 100만 건당 3.4건의 error가 발생하여 검사의 정확도는 99.9997%로 평가되지만, 3인 경우는 100만 건당 66,807건의 error가 발생되어 정확도는 93.3%에 그친다. 따라서 sigma value가 3 이하인 경우는 일반적으로 검사 신뢰도에 문제가 있다는 것을 의미한다. 본 연구는 검사실의 내부정도관리 계획 확립에 도움이 되고자, 자동화학분석기의 검사 항목별로 sigma value를 구하고, 값에 따라서 내부정도관리 물질 개수 및 Westgard rule을 적용하기 위해 시행하였다.
재료 및 방법
고려대학교 안암병원 진단검사의학과 검사실에서 Beckman Coulter AU5821 자동화학분석기(Beckman Coulter, Brea, USA)로 시행한 내부정도관리 데이터를 수집하였다. 내부정도관리는 2018년 4월부터 10월까지 6개월 동안 1일 2회 실시하였는데, 오전과 오후 1회씩 8시간 간격이었고, 상품화된 내부정도관리물질을 다음의 37개 검사항목에 대하여 시행하였으며, 사용한 내부정도관리 물질은 다음과 같았다. C3, C4, haptoglobin, IgA, IgG, IgM, rheumatoid factor (RF)는 AU5821 ITA control (Beckman Coulter)이었으며, alkaline phosphatase (ALP), aspartate aminotransferase (AST), alanine aminotransferase (ALT), albumin, amylase, direct bilirubin, total bilirubin, creatine kinase (CK), creatinine, calcium (Ca), chloride (Cl), iron (Fe), ferritin, potassium (K), sodium (Na), magnesium (Mg), gamma-glutamyltransferase (GGT), glucose, lipase, lactate dehydrogenase (LD), high-density lipoprotein (HDL)-cholesterol, low density lipoprotein (LDL)-cholesterol, total cholesterol, phosphate (Pi), protein, total iron-binding capacity (TIBC), triglyceride (TG), uric acid, blood urea nitrogen (BUN), total carbon dioxide (CO2)는 BECKMAN control (Beckman Coulter)을 사용하였다. 위 37개 검사항목은 모두 Beckman Coulter사의 전용 시약을 이용하여 측정하였으며, 사용한 정도관리 물질은 2가지 농도로 구성되었으며 Low level, High level을 동시에 측정하였다.
총 허용오차는 측정값에 기반하여 의학적결정을 가능하도록 하는 측정검사법이 필요로 하는 성능을 의미한다. 이번 연구에 채택한 총 허용오차는 생물학적 변동을 기반으로 하는 Westgard Desirable Biological Variation Database의 값을 참고하였으며[
5], 누락되어 있는 TIBC 항목은 American Association of Bioanalysts (AAB)의 값을 참고하였다[
6].
바이어스%는 2018년 대한임상검사정도관리협회에서 실시한 1차 신빙도 조사사업의 결과를 가지고 계산하였다. creatinine, HDL-cholesterol, LDL-cholesterol, total cholesterol 및 TG 항목은 정확도 기반 외부정도관리 결과의 데이터를 사용하였고, 정확도 기반검사가 아닌 항목에 대해서는 검사실과 같은 Beckman Coulter사 기기를 사용한 기관들의 평균값을 사용하여 다음과 같은 공식으로 계산하였다.
바이어스%=(본 검사실에서의 얻은 평균값–정확도 기반 외부정도관리 참고값)×100/(정확도 기반 외부정도관리 참고값)
바이어스%=(본 검사실에서의 얻은 평균값–같은 기기로 평가한 기관들의 평균값)×100/(같은 기기로 평가한 기관들의 평균값)
변이계수는 측정의 변동성을 나타내는 지표로 다음과 같은 공식으로 계산하였다.
변이계수%=(표준편차/검사실 평균값)×100
Sigma metrics는 위의 총 허용오차, 바이어스%, 변이계수로부터 다음과 같은 공식으로 계산하였다.
Sigma metrics=(총 허용오차–바이어스%)/변이계수%
마지막으로, 계산된 sigma value에 따라서 적용할 Westgard rule을 선택하는 것은 기존의 제안을 따랐다[
7].
결 과
본 검사실에서 AU5821 자동화학분석기로 시행하여 얻은 sigma value는 다음과 같다(
Table 2). Sigma value가 6보다 큰 검사항목은 haptoglobin, ALP, AST High level, ALT, amylase, direct bilirubin, total bilirubin, CK, Fe, Mg High level, GGT, lipase, LD, HDL-cholesterol High level, protein High level, triglyceride, TIBC High level, ferritin High level, uric acid였고, 그중에서도 direct bilirubin이 Low level에서 22.6, High level에서 26.6의 가장 큰 sigma value를 보였다. 5-6 sigma value를 보인 검사항목은 IgA, RF High level, protein Low level, TIBC Low level이었으며, 3-5 sigma value를 보인 검사항목은 C4 High level, IgM High level, IgG Low level, albumin High level, Pi High level, RF Low level, AST Low level, creatinine, Cl, K, Na, Mg Low level, glucose, HDL-cholesterol Low level, ferritin Low level이었다. Low level과 High Level에서 모두 3보다 작은 sigma value값을 보인 검사항목은 Ca, LDL-cholesterol, total cholesterol, BUN, total CO
2였으며, 그 이외에 3보다 작은 sigma value값을 보인 검사항목은 C4 Low level, IgM Low level, IgG High level, albumin Low level, Pi Low level이었다. 계산된 sigma value에 따라 Westgard rule을 달리 적용하였다(
Table 3).
고 찰
본 연구는 37개의 자동화학분석기 검사항목을 6개월 동안의 내부정도관리 데이터와 신빙도 조사사업 외부정도관리 결과 분석을 통해 바이어스%, 변이계수를 산출하였고 이에 따라서 각 항목별 sigma value를 도출하였다.
결과에 따르면 sigma value가 6보다 큰 검사항목에는 대표적으로 direct bilirubin이 Low level에서 22.6, High level에서 26.6의 가장 큰 sigma value를 보였으며, 6 이상의 값을 보인 항목은 haptoglobin, ALP, AST High level, ALT, amylase, direct & total bilirubin, CK, Fe, Mg High level, GGT, lipase, LD, HDL-cholesterol High level, protein High level, triglyceride, TIBC High level, ferritin High level, uric acid였으며 이들 항목에 대해서는 2가지 level의 정도관리물질을 하루에 한 번씩 검사하여 13S rule을 적용하는 것을 권장하고 있다[
8]. 또한 5-6 sigma value를 보인 검사항목인 IgA, RF High level, protein Low level, TIBC Low level에 대해서는 2가지 level의 정도관리물질을 하루에 한 번씩 검사하여 1
3S/2
2S/R
4S rule을 적용하는 것을, 3-5 sigma value를 보인 RF Low level, AST Low level, creatinine, Cl, K, Na, Mg Low level, glucose, HDL cholesterol Low level, ferritin Low level에 대해서는 2가지 level의 정도관리물질을 하루에 두 번씩 검사하여 1
3S/2
2S/R
4S rule을 적용하여 정도관리를 시행할 것을 권고하고 있다[
8]. 반면 3보다 작은 sigma value를 보인 검사항목은 반복되는 정도관리에도 검사의 질을 보장할 수 없다는 것을 의미하며, 검사방법을 점검하거나 과정을 개선해야만 한다[
4].
대표적으로 가장 낮은 sigma value를 보인 항목에는 total CO
2가 있었으며 3가지 level의 정도관리물질을 하루에 3번씩 검사를 시행하고, 1
3S/2
2S/R
4S/41S/8x rule을 적용하여 모니터링 해야 한다[
9]. QC 물질 Low level, 2중에 3보다 작은 sigma value를 보인 C4, IgM, IgG, albumin, Pi도 같은 rule을 적용해야 한다고 사료된다. 또한 3 이하의 낮은 sigma value를 보인 항목들에서는 원인을 파악하기 위해 우선 제조사가 주장하는 정밀도와 직선성의 검증, 관련 시약과 보정물질 및 정도관리 물질의 안정성에 대한 점검을 시행하여야 할 것이다. 그러한 점검에도 불구하고 이후 평가에서도 낮은 sigma value를 보이는 항목에 대해서는 시약과 장비의 교체를 고려해야 할 것이다.
자동화학분석기의 검사항목들의 sigma value를 계산한 선행연구 결과와 이번 연구를 비교해보면 Mao 등[
3]의 연구에서는 6 이상의 sigma value를 보인 항목은 uric acid, HDL-cholesterol, total bilirubin, ALT, TG, creatinine이었고 3 미만의 sigma value를 보인 항목은 Na였다. El Sharkawy 등[
10]의 연구는 5개월간의 연구기간의 누적 변이계수를 사용한 결과에서 6 이상의 sigma value를 보인 항목은 total bilirubin, TG였고 3 미만의 sigma value를 보인 항목은 albumin, creatinine, Ca, K, Mg이었다. Kumar 등[
11]의 연구는 1년간의 내부정도관리 결과를 사용하여 ALP, Mg, TG, HDL-cholesterol이 6 이상의 sigma value를 보였고, total bilirubin, albumin, cholesterol, K에서 3 미만의 sigma value를 보였다. 본 연구에서도 선행연구들과 같이 TG가 6 이상의 sigma value를 보인 것 이외에는 공통점이 없었는데, 이는 연구마다 사용한 장비도 다르고, 적용한 총 허용오차, 바이어스%의 계산법, 변이계수 등이 달랐기 때문으로 생각된다. 선행연구 중에서 특히 Mao 등의 연구에서는 본 연구와 동일한 Beckman Coulter사의 AU5800 장비 및 총 허용오차 데이터베이스를 사용하였고 변이계수는 5개월 동안의 누적 평균치를 사용하였다. 또한 같은 기기를 사용한 기관들의 평균을 이용하여 바이어스%를 구한 점에서 본 연구와 가장 비슷한 조건이었기에 비교에 적합하다고 판단된다. 6 이상의 sigma value를 보인 uric acid, HDL-cholesterol, total bilirubin, ALT, TG는 본 연구에서도 6 이상의 sigma value를 보였지만 creatinine의 경우 본 연구에서는 3-5 sigma value를 보였다. 같은 총 허용오차를 사용하였고 변이계수는 비슷한 값을 보였지만 바이어스%의 경우 Mao 등의 연구에서는 같은 장비를 사용하는 기관 간의 평균값을 사용하였지만, 본 연구는 정확도 기반 외부정도관리 참고값을 차용하였기 때문이라고 생각된다. 따라서 creatinine의 경우 본 연구의 결과값이 신뢰성 있는 sigma value를 산출하였다고 사료된다. 3 미만의 sigma value를 보인 Na의 경우 본 연구에서는 3-5 sigma value를 보였는데, 이는 Mao 등의 연구에서 변이계수값이 Low level, 2에서 각각 1.21, 1.43이었지만 이번 연구에서는 0.89, 0.85로 더 높은 정밀도를 보였기 때문이라고 판단하였다. Sigma metrics는 바이어스%가 작거나, 총 허용오차가 변이계수에 비해 지나치게 큰 경우에는, 이번 연구의 direct bilirubin, haptoglobin, ALP, GGT, lipase, uric acid 항목과 같이 과도한 sigma value를 보이게 된다. 본 연구에서 sigma value가 가장 작게 나온 CO
2, total의 경우는 총 허용오차에 비해 큰 변이계수를 보였는데 선행연구에서는 시행하지 않아 비교할 수 없었다. 하지만 Beckman Coulter사의 CO
2, total 시약의 manual에서는 권장 변이계수가 3.0-4.5%인데 반해, 이번 연구에서의 변이계수가 Low level, 2에서 각각 7.828, 6.761%로 높은 것으로 볼 때 CO
2, total 검사항목 정도관리물질의 불안정성 때문이나, 검사장비의 calibration 후 시약의 rotation으로 인한 CO
2, total 농도 측정값의 감소 때문에 나타났다고 추정된다[
12]. 대상 검사항목의 경우 기존 연구[3, 10, 11]에서는 16개에서 20개 사이였지만 이번 연구는 자동화학분석기에서 시행하는 CO
2, total 등을 포함한 37개의 전반적인 항목에 대한 포괄적인 분석을 시행한 점이 장점이다.
이번 연구에서 보여진 sigma value의 유용성은 다음과 같다. 먼저 sigma value에 따라 검사항목별로 다른 내부정도관리를 시행함으로써 검사실의 효율적인 운용에 실질적 도움이 될 수 있다. 또한 sigma value가 낮은 검사 항목을 파악해서, 검사과정에서 부적절한 시약 처리, 운반, 보관 및 전처리 과정, 부적절한 보정과 정도관리 및 불충분한 검사실의 인력과 환경문제 등과 같은 원인들을 파악하고 개선하는 질관리 활동을 촉진시킬 수 있다[
10]. 마지막으로 sigma value는 새로 도입하려는 기기나 시약의 평가에 유용한 정보를 제공하며, 장비 간의 성능에 대한 비교 분석이 가능하다. 또한 신뢰할 수 있는 결과를 제공함으로써 질병의 진단과 치료에 기여하여 결론적으로 검사실의 높은 신뢰도를 얻을 수 있다[
13].
본 연구의 한계점은 바이어스%를 계산할 때 차용한 신빙도 조사사업 결과에서 정확도기반검사가 아닌 항목에 대해서는 검사실과 같은 Beckman Coulter사 기기를 사용한 기관들의 평균값을 이용함에 따라 각 기관들마다 sigma value의 동등성(comparability)에 문제가 있을 수 있다는 점이다. Sigma value의 동등성은 검사결과 측정 시간과 간격, 정도관리 검체의 차이, 검사실 환경의 차이 등에 의해 영향을 받을 수 있다. 따라서 같은 자동화학분석기를 사용한 기관들의 평균도 참값이라고 보기 어려우므로 정확도 기반 외부정도관리 결과값이 있는 creatinine, HDL-cholesterol, LDL-cholesterol, total cholesterol 및 TG에서만 정확한 바이어스%를 계산할 수 있으므로, sigma value의 해석에 주의해야 할 것이다. 또한 외부정도관리결과에서 같은 제조사인 Beckman Coulter로 보고한 결과도 장비의 종류나 사용한 시약이 다를 수 있기 때문에 해석에 유의하여야 한다. 이처럼 sigma metrics를 이용한 검사실의 정도관리 방법은 검사실 간의 표준화 및 조화(standardization & harmonization)가 힘든 것이 가장 큰 단점이다[
10]. 또한 sigma value를 통한 성능 평가의 한계점은 총 허용오차가 바이어스%에 비해 지나치게 큰 경우에는 과도한 sigma value가 산출될 수 있으며, sigma value가 6 이상인 항목에 대해 Westgard에서 권고하는 대로 1
3S rule만 적용하게 되면 random error는 검출이 가능하지만, 검사장비나 시약의 불안정성 때문에 발생하는 systemic error의 검출이 저하될 수 있다.
이런 한계에도 불구하고 검사실 자체적으로 항목별로 sigma value를 계산하는 것은 중요하다. 특히, sigma value는 검사항목별로 다른 Westgard rule을 채택하게 하는 근거이면서 효율적인 정도관리 및 운영에 기여하는 유용한 기법이다.