Journal List > Lab Med Online > v.10(2) > 1145143

임상검사실에서의 액체크로마토그래피-질량분석을 위한 권고안: 제2편. 검사법 검증

초록

진단검사의학 분야에서 정확한 진단을 위하여 액체크로마토그래피-탠덤질량분석기(liquid chromatography-tandem mass spectrometry, LC-MS/MS)를 이용한 검사의 수요는 증가할 것으로 예상되지만, 여러 가지 이유로 LC-MS/MS 검사를 임상검사실에 도입하는 것은 여전히 쉽지 않다. 임상검사실에서 LC-MS/MS 검사 도입 시 검사 성능 평가 방법은 종류가 다양하고 아직까지 표준화되어 있지 않은 실정이다. 따라서, 새로운 LC-MS/MS 검사를 임상검사실에 도입하고자 할 때 필요한 검증 방법의 종류와 평가 기준에 대하여 여러 자료를 수집하고 분석하여 기술하고자 하였다. 국내 및 국외의 관련 자료를 검토하여 최소한으로 필요한 검증 항목과 평가 방법 및 기준을 포함하였다. 정량검사의 전체 검증 시 일반적으로 필요한 항목과 여러 지침을 참고하여 정확도, 정밀도, 보정, 특이도, 이온화 억제 및 향상, 검출한계/정량한계, 안정성, 참고구간, 잔효, 그리고 희석연속성 등의 검증항목에 대해 기술하였다. 이 중 정확도, 정밀도, 보정, 특이도, 이온화 억제 및 향상 등의 다섯 항목은 LC-MS/MS 정량 검사법 검증의 필수 항목으로 여러 가이드라인에서 공통적으로 제시하고 있다. 그 외 검출한계/정량한계, 안정성, 참고구간, 잔효, 희석연속성 등은 검사 및 물질의 특성에 따라 추가 검증이 필요한 항목들이다.

Abstract

The demand for obtaining test results using liquid chromatography-tandem mass spectrometry (LC-MS/MS) for accurate diagnosis in the field of laboratory medicine is expected to increase, but it is still not easy to introduce diagnostic methods using LC-MS/MS into clinical laboratories for many reasons. There are many different methods used to evaluate the performance of LC-MS/MS in clinical laboratories, which have not been standardized to date. Thus, various data have been analyzed and described based on the type of validation method used and the criteria needed to introduce a new test using LC-MS/MS in a clinical laboratory. Relevant data from home and abroad were reviewed to include the minimum number of validation items required and methods of implementation. In general, the items required for a full validation of the quantitative test and various guidelines were used to summarize the following validation items: accuracy, precision, calibration, specificity, ion suppression or improvement, limit of detection, limit of quantification, stability, reference interval, carryover, and dilution integrity. Among these, the first five items mentioned beforehand are essential parameters for LC-MS/MS validation and are presented in numerous guidelines. The other parameters are required for further verification depending on the characteristics of the analysis and the analytes. This recommendation is intended to outline and present the validation methods that should be carried out when introducing new tests in clinical laboratories using LC-MS/MS with reference to the existing guidelines and literature containing expert opinions.

서 론

2000년대 초 임상검사실에 액체크로마토그래피-탠덤질량분석기(LC-MS/MS, liquid chromatography-tandem mass spectrometry)가 도입된 후, 이를 이용한 임상 연구의 종류가 매우 다양해졌고 환자를 대상으로 한 검사 종류와 건수가 점차 증가하고 있다. 앞으로도 진단검사의학의 다양한 분야에서 정확한 진단을 위하여 LC-MS/MS를 이용한 검사결과를 필요로 하는 수요는 증가할 것으로 기대되지만, 고가의 장비, 전문 인력의 필요성, 임상 검사 전문 장비 및 시약 회사의 희소성, 의료진 대상 홍보 부족 등의 이유로 LC-MS/MS 검사를 임상검사실에 도입하는 것은 여전히 쉽지 않은 편이다. 상용화된 진단 키트가 조금씩 개발되고 있지만, 고가의 키트 시약 비용이 부담스러운 검사실에서는 보고된 문헌을 참고하거나 자체적으로 개발한 방법을 이용하는 것을 선호하는 편이다. 또한 아직까지도 LC-MS/MS를 사용한 검사를 도입할 때 임상검사실마다 수행하는 검사 성능 평가 항목과 방법이 다양하고 표준화되어 있지 않은 실정이다. 이에, LC-MS/MS를 이용한 검사법을 임상검사실에 도입하고자 할 때 필수적인 성능 검증 방법의 종류와 평가 기준에 대하여 여러 자료를 수집, 분석하고 기술하고자 한다.
측정 방식에 따라 다양한 종류의 질량분석기가 있지만, 현재 임상검사실에서 가장 많이 도입된 LC-MS/MS를 이용한 검사법의 성능 검증을 중점적으로 다루었다. 특히 새로운 검사를 자체적으로 개발하는 경우보다, 기존에 다른 연구자에 의해 이미 개발된 검사법을 임상검사실에 도입하고자 할 때 필요한 검증 내용을 위주로 구성하였다. 진단검사의학재단의 우수검사실 인증에 대비할 수 있도록 심사 체크리스트에서 요구되는 분석능 평가 항목을 위주로, 국내 및 국외의 검사법 평가 관련 지침 및 자료를 검토하여 최소한의 검증에 필요한 항목과 수행 방법을 포함하였다.

LC-MS/MS검사 도입을 위한 검사법 검증

1. 참고문헌 및 검증의 종류

검사법 성능 검증의 주요 목적은 혈액, 소변 또는 침 등의 생체시료에서 분석물질 농도를 결정하기 위한 분석 방법의 신뢰성을 입증하는 것이다. LC-MS/MS를 이용한 검사를 도입할 때 요구되는 검증 방법은 다양한 참고 문헌에 소개되어 있으며, 검사의 목적과 특성에 따라 검증을 위한 평가 항목에 조금씩 차이가 있다.

1) 참고문헌

본 논문에서 참고한 문헌은 다음과 같다.
  • -Guidance for Industry: Bioanalytical Method Validation (2001년, FDA) [1]

  • -Guideline on Bioanalytical Method Validation (2011년, EMEA) [2]

  • -Mass Spectrometry in the Clinical Laboratory: General Princi-ples and Guidance C50-A (2007년, CLSI) [3]

  • -Liquid Chromatography-Mass Spectrometry Methods C62-A (2014년, CLSI) [4]

  • -I nternational Conference for Harmonization (ICH) guideline (2005년) [5]

  • -Harmonized Guidelines for Single Laboratory Validation of Methods of Analysis (2002년, IUPAC) [6]

  • -Standard Practices for Method Validation in Forensic Toxicol-ogy (2013년, SWGTOX) [7]

  • -생체시료 분석법 밸리데이션 해설서 (2010년, 식품의약품안전청) [8]

  • -우수검사실 인증심사 점검항목 (2019년, 진단검사의학재단) [9] (약어 : CLSI, Clinical and Laboratory Standards Institute; FDA, Food and Drug Administration; EMEA, European Medicines Agency; IUPAC, International Union of Pure and Applied Chemistry; SWGTOX, Scientific Working Group for Forensic Toxicology)

이 중 LC-MS/MS만을 다룬 문헌은 CLSI C62-A [4]가 유일하며,다른 문헌은 면역측정법, 화학적 측정법을 포함한 생체시료 분석법 전반의 내용을 다루거나, 다른 질량분석기법을 포괄적으로 다룬 것이 대부분이었다.

2) 검증의 종류

LC-MS/MS를 이용한 검사법의 검증 수준은 도입하고자 하는 임상검사실의 필요에 따라 달라질 수 있으며, FDA와 식품의약품안전처(과거, 식품의약품안전청)의 문서를 참조하면 검사법 검증에는 검증의 유형과 수준에 따라 다음 세 종류로 구분된다.
(1) 전체 검증(Full validation)
전체 검증은 다음과 같은 경우에 실시한다.
  • -생체 시료 분석법 최초 개발 시

  • -문헌에 기초한 분석법 개발 시

  • -기존 분석법에 새로운 분석물질이 추가되는 경우

(2) 부분 검증(Partial validation)
부분 검증은 이전에 전체 검증된 분석법을 변경하는 경우에 실시하며, 예시는 다음과 같다.
  • -실험실, 분석법(검사기기 변경 등), 또는 시험자의 변경

  • -혈액 사용 시 항응고제, 기타 보존제의 변경

  • -동일 종에서 대상 검체의 종류 변경(사람 혈장에서 사람 소변으로 변경)

  • -동일 생체 시료의 종간 변경(쥐 혈장에서 생쥐 혈장으로 변경)

  • -시료 전처리 과정의 변경

  • -측정 가능 농도범위의 변경

  • -검사 기기, 소프트웨어, 주변 기기, 검체 보관방법 등의 변경

  • -희귀한 생체 시료인 경우(골수, 조직 흡인액 등)

  • -시료 용량이 제한된 경우(미숙아, 땀 등)

부분 검증의 경우, 전체 검증 과정의 최소 수준(정밀도, 정확도, 보정, 특이도, 이온화 억제 및 향상)부터 거의 전체 검증에 달하는 수준까지 필요에 따라 다양한 수준의 검증을 수행한다.
(3) 교차 검증(Cross validation)
교차검증은 두 가지 이상의 검사법을 비교하기 위해 시행하며,검증된 기존 분석법과 비교한다.
  • -하나의 연구과정 중 여러 검사실에서 동시에 검체를 측정할 때

  • -다른 측정원리의 검사방법과 비교할 때(LC-MS/MS와 ELISA를비교)

교차 검증에는 정도관리물질 혹은 환자 검체를 사용하여 검사방법 간 차이를 확인한다. 정도관리물질 측정 결과는 검사방법 간 차이가 15% 이하일 것을 권장하며, 환자 검체 측정 결과는 최소 2/3의 검체에서 20% 이내의 차이를 보일 것을 권장한다[2].
정확도, 정밀도, 보정, 특이도, 이온화 억제 및 향상 등 다섯 항목은 검증의 가장 기본적인 항목으로서 정량 검사법 검증 시 필수적으로 시행할 것을 권장한다. 주요 지침에서 권장하는 검증 항목의 종류와 용어에 대해 Table 1에 정리하였고, 각 지침에서 적어도 한 소제목 이상 상세히 기술한 검증 항목에 대해서는 검증 물질, 농도 수준, 검증 방법 및 평가 기준에 대해 각각 표로 정리하였다(Tables 2-7). 일반적으로 정량검사의 전체 검증 시 필요한 항목과 여러 지침에서 권장하는 내용을 정리하면 다음과 같다.
  • -정확도(accuracy, trueness)

  • -정밀도(precision)

  • -보정(calibration)

  • -특이도(specificity, selectivity, and interference)

  • -이온화 억제 및 향상(ion suppression or enhancement)

  • -검출한계(limit of detection, LOD)와 정량한계(limit of quantification, LOQ)

  • -그 외 안정성(stability), 참고구간(reference interval), 잔효(carryover), 희석연속성(dilution integrity)

선별검사 혹은 정성검사인 경우에는 정량검사보다 검증이 필요한 항목이 제한적이며 기본적인 항목은 다음과 같다.
  • -검출한계 혹은 판정기준치(cut-off)

  • -특이도(specificity)

  • -이온화 억제 및 향상 (ion suppression or enhancement)

위 항목들은 필요로 하는 반복 측정 횟수, 수행(run) 횟수, 평가
수행 일자 수가 가이드라인마다 조금씩 다르나 검증 항목 및 방법의 특징에 따라 이를 적절히 조정할 수 있다. LC-MS/MS에서 많이 사용하는 96개 평판(96 well plate) 혹은 54개 평판(54 well plate)을 하나의 수행(run)으로 묶어서 위 검증 항목들을 동시에 수행할 수도 있다. 필수로 구분된 다섯 항목 중에서도 정확도, 정밀도, 보정선의 경우 보통 하나의 수행에서 반복 측정 가능하며, 이 수행을 며칠에 걸쳐 반복 시행한다. 특이도와 이온화 억제/향상은 위 세 항목과는 다른 물질 혹은 실험법이 추가로 필요하다. 각각의 수행에서 가능한 검증 항목과 이에 필요한 검체 등은 최근에 출간된 교과서 에 자세히 기술되어 있다[10].

2. LC-MS/MS검사 도입 시 검증항목

1) 정확도(Accuracy and trueness) (Table 2)

정확도는 분석물질의 참값에 대한 측정값의 일치 근접도(closeness of agreement)로 정의되며, 흔히 참값과 측정값의 차이를 참값으로 나눈 백분율인 편차(bias)를 쓰거나, 측정값을 참값으로 나눈 백분율인 회수율(recovery)을 사용한다. 분석물질의 참값을 구하기 위해서는 동일성과 순도가 알려진 표준물질이 필요하다. 표준물질은 National Institute of Standards and Technology (NIST)나 Joint Committee for Traceability in Laboratory Medicine (JCTLM)으로부터 제공되는 인증표준물질(certified reference material)이추천되며 이외에 표준검사법(reference method)에 의해 측정된 값을 갖는 물질 또는 검체가 있는 경우, 이를 이용할 수 있다. 그러나 인증표준물질을 구하기 어렵다면 회사에서 판매하는 상용화된 물질이나, 실험실에서 합성된 물질 중 순도가 알려진 물질을 사용할수 있다. 분석물질과 동일한 표준 물질을 사용하기 어렵다면, 산,염기 혹은 염(salt)과의 혼합물 중 순도가 알려진 것을 사용할 것을 권장한다.
그러나 현실적으로 정확도 검증은 부여 된 값(assigned value)을 갖는 정도관리물질을 제조 또는 구매하여 사용하는 경우가 많다. 일반적으로 여러 검체를 혼합한(pooling) 물질이 검체와 기질이 유사한 정도관리물질보다 선호되며, 제조된 용액(이동상, 용매 등)과 같은 비생물학적 물질은 가급적 피하도록 한다. 외인성 물질을 첨가(spiking)할 때 기질은 가급적 환자 검체와 동일해야 하지만, 어려울 경우 상호 교환성(commutability)이 있는 생물학적 기질이 추천된다. 내인성 물질을 측정해야 하는 경우에는 사용할 검체에서 이를 제거한 기질을 사용할 수 있는데, 만약 내인성 물질을 제거한 후에도 측정물질 이 정량하한값의 20% 이상 검출된다면 기질을 제조하여 사용할 수도 있다[4]. 만약 정확도 검증을 위한 정도관리물질을 제조하게 되면, 정확도 검증에 사용할 물질은 보관용액(stock solution)에서부터 보정물질(calibrator)과 별개로 제조하여야 한다.
정확도 검증을 위해서는 적어도 3가지 농도의 물질이 필요한데, 저농도는 정량하한값의 3배 정도, 고농도는 정량상한값의 75%에서 100% 사이, 중간 농도는 저농도와 고농도의 평균값(또는 약물의 경우 예상 혈중 최고농도)으로 설정할 것을 권장하며, 필요하면 정량하한값 농도를 추가할 수 있다[2]. 분석 방법은 하나의 수행(run)에서 농도당 3-5회 반복 측정할 것을 권장하며[1, 5], 이러한 수행을 최소 2일 이상의 기간에 걸쳐 최소 세 번 이상 시행할 것을 권장한다[2]. 즉, 여러 날짜에 걸쳐 하루 두 번 이상의 수행을 통하여(예, 1일차 2회 수행, 2일차 2회 수행), 최소 3회의 수행을 시행하되 한 수행 당 3-5번의 반복 측정을 하면 농도당 최소 9-15개의 측정값이 산출될 수 있다.
대부분의 LC-MS/MS 측정법은 검체의 전처리 과정을 통해 생성된 추출액(extract)을 주입하는데, 하나의 검체에서 별개의 전처리 과정을 거친 여러 추출액을 한 번씩 측정하거나, 하나의 검체에서 전처리 과정을 거친 하나의 추출액을 여러 번 반복 측정할 수도 있다. 예를 들면, 3개의 반복 측정값을 얻는 데에도, 한 검체에서 3번 추출을 따로 시행하여 얻은 3개의 추출액을 한 번씩 측정하거나, 한 검체에서 1회 추출하여 얻은 1개의 추출액을 세 번 측정하는 방식이 존재하게 된다. 후자는 LC-MS/MS 분석 시스템의 변이(variation)를 평가하고 전자는 추출법의 변이를 평가하므로, 두 요소를 모두 평가할 수 있는 프로토콜을 준비하는 것이 필요하다.
정확도 허용 기준은 검사법의 보정선(calibration curve)에 의해 계산된 측정값의 평균과 이미 알고 있는 명목값과의 차이를 명목값에 대한 백분율(편차 %)로 계산하였을 때(아래 계산식 참조), 이 편차가 15% 이내이어야 하며, 정량하한값에서는 20%를 넘지 않을 것을 권장한다[1].
% = ( -)/ ×100
검사법 간 비교를 통한 정확도 검증은 측정 가능한 전체 농도 범위를 포함하면서 최소 40개의 서로 다른 검체를 이용하여 상위 계층의 표준방법과 비교 평가한다. 그러나 현재 임상검사실에서 측정하는 항목들은 표준검사법에 의한 표준화가 이루어지지 않은 것이 대부분으로, LC-MS/MS 검사법 검증 시 표준검사법이 아닌 기존 검사법과 LC-MS/MS 검사법을 비교하는 경우에는 정확도를 검증한다고 보기 어렵고, 기존 검사법의 참고구간(reference interval)을 참조(transferring)하는데 유용하게 이용할 수 있다.

2) 정밀도(Precision) (Table 3)

정밀도는 분석물질의 측정값을 반복 측정할 때 서로 유사한지를 의미하며, 일반적으로 표준편차를 평균으로 나눈 변이계수(coefficient of variation, CV)로 나타낸다. 정밀도는 하나의 분석 배치 동안 정밀도를 평가하는 수행내/배치(batch)내 정밀도 또는 반복정밀도(repeatability)와 여러 분석 배치 간의 정밀도를 평가하는 수행간/배치간 정밀도 또는 재현성(reproducibility)으로 분류할 수 있다. 수행간 정밀도는 분석 시간, 검사자, 장비, 시약, 검사실의 변화로 인한 측정값의 변동을 포함한다. 이러한 변동 항목 각각에 대해 정밀도를 따로 평가할 필요는 없으며, 실제 검사실에서 일어날 수 있는 변동을 총괄하여 검증한다.
분석물질의 기질은 실제로 측정할 임상 검체를 혼합할 것을 권장하지만, 이 방법이 어렵다면 상용화된 정도관리물질을 사용할 수도 있다. 실제 검사 시에 상용화된 정도관리물질을 사용할 예정이라면, 검사법 검증 시에 임상 검체도 함께 검사하여 두 물질 사이의 기질 불일치를 확인하도록 한다[4]. 정밀도 검증을 위한 분석물질의 농도는 검증하고자 하는 검사법의 측정 가능 농도 범위를 포괄하면서, 의학적 의사 결정값의 ±25% 농도 수준을 포함해야 한다[4]. 만약 검체를 혼합한 고농도와 저농도 검체 풀이 측정 가능 농도 범위를 포함 하지 못하면, 표준물질을 첨가하거나 저농도 검체 풀을 적절한 희석액으로 희석할 수 있으며, 이와 같은 경우에는 희석액에 의한 잠재적인 기질 효과도 고려해야 한다. 많은 지침에서는 공통적으로 분석법의 측정 가능 농도 범위 내에서 최소한 저, 중, 고의 3가지 농도와, 가능하면 정량 하한값을 포함할 것을 권장한다[1, 2, 5]. 한 수행에서는 농도당 최소 5회 반복 측정할 것을 권장하며[1], 이러한 수행을 최소 3회 이상 다른 날짜에서 시행할 것을 권장하고 있다[2, 5]. 각 농도의 평균과 표준편차를 구해 변이계수를 계산하는데, 배치내 정밀도, 배치간 정밀도와 총 정밀도의 경우 ANOVA로 분석하여 계산할 수 있다.
정밀도 허용 기준은 변이계수가 15% 이내(정량하한값에서는 변이계수 20% 이내)로 주요 지침에서 제시하고 있다[1, 2, 4]. 그러나 이런 기준값을 모든 분석물질에서 적용할 수 있는 것은 아니며, 의학적 의사 결정값과 그 근처에서의 분석물질의 총 허용오차를 고려하여 변경할 수 있다. 총 허용오차는 분석물질의 생물학적 변이, 전문가 그룹에 의해 수립된 임상 지침 등을 고려하여 설정할 수 있다.

3) 보정(Calibration) (Table 4)

보정선(calibration curve)은 분석물질의 농도와 기기의 반응과의관계를 나타내며, 이를 적절히 정의하기 위해서는 충분한 수의 보정물질 을 사용해야 한다. 보정물질은 분석 검체와 동일한 생물학적 기질에 농도값을 아는 표준물질을 첨가하여 준비하고, 정량 측정하고자 하는 분석물질에 대한 각각의 보정선을 생성해야 한다.
여러 지침을 참고할 때, 보정물질은 공시료(blank sample, 측정물질과 내부표준물질 모두 없는 기질), 영시료(zero sample, 측정물질은 없고 내부표준물질만 첨가된 기질)와 예상 측정 범위를 포함하는 6-8가지 농도로, 측정하는 임상 검체와 동일한 기질로 제조한다[1, 2, 5]. 보정물질의 가장 높은 농도는 정량상한값, 가장 낮은 농도는 정량하한값으로 제시할 수 있으나, 정량하한값은 추가적인 방법으로 계산, 검증할 수도 있다.
보정선은 보통 직선을 많이 사용하지만, 다항식을 이용한 회귀 혹은 가중치(weighting)를 사용하여 농도-반응 관계를 가장 적절하게 설명할 수 있는 모델을 적용한다. 공시료, 영시료는 보정선을 구할 때 포함하지 않으며, 직선의 경우 기울기 및 절편으로 보고한다. 보정선의 회귀식과 함께 결정계수(R2)를 구할 수 있지만 이것으로만 보정선을 검증하는 것은 추천되지 않으며, 각 농도에서의 편차를 확인해야 한다. 회귀식을 통해 역산(back calculation)한 보정물질의 농도와 명목값과의 편차는 15% 이내여야 한다[2]. 즉, 1,000 ng/L의 물질을 만들었으면 보정선을 통해 역산한 농도가 850-1,150ng/L 사이여야 한다. 단, 정량하한값 농도에서는 편차 한계를 20% 이내로 설정할 수 있다. 6개의 보정물질의 농도 가짓수 중 정량하한값과 정량상한값을 포함하여 최소 75% 이상이 보정 기준을 충족해야 한다[1, 2]. 보정물질을 반복 측정한 경우에는 각 농도에서 반복 측정값의 최소 50% 이상 개수에서 위 기술한 편차 기준을 충족해야 한다[2]. 즉, 공시료를 제외한 6개 보정물질을 사용한다면 5개 이상에서 위 기준을 충족해야 하고, 5번 반복 측정 시 3번 이상 위 기준을 충족해야 한다. 만약 기준을 벗어나는 보정물질이 있을 경우 이를 제외하고 다시 회귀 분석하여 보정선을 재평가해야 한다. 만약 정량하한값 또는 정량상한값의 모든 반복 측정치가 기준을 벗어난다면 이 배치는 보정선 검증이 되지 않은 것으로 간주하고 원인 분석과 함께 필요 시 검사법의 수정도 고려해야 한다.
측정물질에 따라 다르지만, 일반적으로 LC-MS/MS를 이용하여 정량 측정할 때 보정물질의 농도 범위는 통상 100배(예, 10 ng/mL에서 1,000 ng/mL) 내외로 설정하는데, 그 이상의 농도 범위에서는 검출기가 포화되어 농도-반응 간의 선형성에 문제가 생기는 경우가 있기 때문이다. 만약 넓은 범위의 농도가 검체에서 자주 측정되고 이를 정확히 보고할 필요가 있는 경우 보정물질의 수를 늘리거나, 희석 프로토콜을 만들어 검증하고 측정 범위를 한 구간 더 넓게 검증해야 한다. 농도-반응의 선형성을 검증하는 프로토콜은 위와 다른데, 보통 보정물질의 농도 간격이 지수 형태로 이루어져 있다면(2배, 2.5배 등) 직선성을 검증하기 위해서는 같은 간격의 농도로 된 검체를 준비하여야 한다(200, 400, 600 ng/mL 등). 상세한 프로토콜은 CLSI EP6-A 에 잘 기술되어 있다[11] .

4) 선택성(Selectivity)/특이성(Specificity) (Table 5)

선택성은 시료의 다른 구성 요소로부터 분석물질을 분별하여정확하게 측정하는 능력이다. 특이성이 높은 검사법은 분석물질과 내부표준물질을 유사물질, 복잡한 생체 기질, 간섭 물질 등으로부터 원활하게 분리할 수 있다. LC-MS/MS 기법은 크로마토그래피 분리와 질량분석기 측정이 결합되어 있어 분자의 질량, 전하량 및 파쇄 성질에 따라 특이적으로 측정하므로 단독 크로마토그래피나 면역분석법에 비해 특이성이 우수한 것으로 알려져 있다. 그럼에도 불구하고, 복잡한 기질에서는 여전히 간섭이 발생할 수 있으므로 모든 잠재적 간섭이 평가되어야 한다. 이론적으로 최종 결과물이 잘 정제되어 있지 않은 추출법인 경우, 측정물질과 같은 분자량을 가진 간섭물질(isobaric compounds)이 전처리 후 검체에 존재할 가능성이 더 높다.
간섭물질은 분석물질의 전구 물질, 거울상 이성질체, 가능성 있는 대사 산물을 포함하며, 그 외에 투여되는 병용 약물과 그 대사산물, 항응고제, 보존제 등도 검증 대상이 될 수 있다. 만약 내인성 물질이 분석 대상이어서 이를 전혀 포함하지 않은 검체가 존재하지 않거나 구하기 어려운 기질이 분석 대상인 경우, 검체 기질과 유사한 적절한 빈 기질(surrogate blank comparable to the sample matrix)이 기질 효과 연구에 대신 사용될 수 있다. 기질 효과를 유발하는 것으로 알려진 첨가제, 예를 들면 폴리에틸렌 글리콜 또는 폴리소르베이트가 주사제에 추가되는 경우, 간섭 효과는 빈 기질과 더불어 이들 첨가제를 함유하는 기질로 연구되어야 한다. 특수 인구 집단(신장 또는 간 기능 부전 환자 등)의 시료를 분석하는 경우, 그러한 집단의 기질을 사용하여 기질 효과를 연구하는 것이 좋다.
잠재적 간섭 피크의 가능성을 분석하되 우선 검사 시스템 내에서 검사에 적합할 정도로 작은 배경소음(background noise)을 갖고 있는지 확인해야 한다. 선택성을 위해 최소한 6개의 소스로부터 적절한 생물학적 기질(혈장, 소변 등)을 얻어 공시료에서 측정물질과 내부표준물질의 신호가 개별적으로 평가되어야 한다. 이것은 검체 전처리부터 분석에 이르기까지 모든 검사 시스템의 배경소음을 반영하며, 정량하한값의 분석물질에서 관찰되는 피크 면적의 20% 이내, 내부표준물질에서는 5% 이내로 관찰되어야 한다[2, 4]. 전체적인 검사과정에서 불안정한 대사 산물이 분석물질로 역변화될 가능성도 평가되어야 한다(예: 산성 환경에서 ester 대사 산물, 불안정한 amide 산화물 또는 glucuronide 대사 산물 등)[2]. 어떤 경우에는 관심 있는 대사 산물을 얻는 것이 매우 어려울 수 있는데, 안정성에 대한 자료가 확보된 기존 샘플을 재분석함으로써 대사 산물의 역변화 여부를 확인할 수 있다.
내부표준물질로서 안정 동위 원소로 표지된(stable isotopically labeled) 분석물질을 사용하는 경우, 동위원소로 표지되지 않은 비표지화합물(non-labeled compound)이 불순물로 함유되어 분석물질과 동일하게 측정될 수 있다. 또한, 동일하지 않더라도 구조적으로 유사한 표지물질(labeled analogue)의 질량 스펙트럼이 분석물질의 중요한 이온과 동일한 m/z 값을 가질 수도 있다. 이러한 두 가지 모두 내부표준물질이 분석물질의 식별 또는 정량에 영향을 미치는 경우이다. 안정 동위 원소 내부표준물질에 의한 간섭은 내부표준물질만 추가된 빈 기질에서 분석물질의 신호를 관찰하여 평가할 수 있다.
마지막으로 간섭물질에 대한 실험은 이론상 분석물질에 가장 영향을 미칠 것으로 예상되는 간섭물질에 대해서 평가할 것을 권장한다. 앞서 언급한 병용 약물, 질환 특이적인 내인성 물질, 분석물질의 대사물질, 전구물질, 구조적 유사물질 등에 대해서 검색하고 필요한 경우 표준물질을 구입하여 간섭 현상에 대해 평가할 수 있다. 기질 없는 시료(혈액 없는 채혈관, 혈액 없는 여과지 등)에 전처리 과정을 거친 후 측정하면 항응고제나 첨가제의 배경 소음에 대한 영향을 평가할 수 있다. 공시료에 측정 표준물질만을 첨가한 시료와 분석물질에 간섭물질을 추가한 시료를 비교하여 분석물질 정량에 대한 간섭물질의 영향을 평가할 수 있다. CLSI EP7-A2에서 제안한 실험에서는 서로 다른 기질을 여러 비율로 섞어서 검체 특이적인 기질 효과가 존재하는지 평가할 수 있다[12].

5) 이온화 억제/향상(Ion suppression/enhancement) (Table 6)

이온화 억제(ion suppression)는 질량분석기의 검출기까지 도달하는 이온의 양이 감소하는 현상을 말하며, 반대로 증가하는 현상은 이온화 향상(ion enhancement)이라고 한다. 이는 기질에 포함된 염, ion pairing agent, 지질, 단백질, 펩타이드, 작은 유기물 등 화합물이 분석물질과 동시에 용출(elution) 되면서 영향을 미쳐 생기는 현상으로, 그 중에서도 내인성 물질인 인지질(phospholipids)의 영향이 큰 것으로 알려져 있다. 그 외에 다양한 외인성 물질이 영향을 미칠 수 있으며, 플라스틱 채혈관의 폴리머, 항응고제, 혈장/혈청 분리용 젤 등이 알려져 있다. 이온화 억제/향상 현상은 어떠한 이온화 방법에서도 일어날 수 있으나 electrospray ionization 에서 문제가 되는 경우가 가장 흔하며, 위에서 언급한 화합물이 질량분석기 소스에서의 스프레이 방울(spray droplet) 생성을 변화시켜 나타난다고 알려져 있다.
기질에 의한 이온화 억제 현상은 검사법 전체 혹은 특정 검체에 영향을 줄 수 있으며, 회수율을 감소시키거나 간섭 피크를 발생시켜 결과 오류를 일으킬 수 있다. 따라서 이러한 기질 효과를 효과적으로 평가하는 것은 LC-MS/MS검사법 평가의 중요한 과정 중 하나이다. Electrospray ionization에서 발생하는 이온화 억제 현상을 위한 몇 가지 해결방법이 있는데, trifluoroacetic acid (TFA)와 같은 ion-pairing 물질은 다른 약한 산(acetic, formic, and heptafluorobutyric acid)으로 대체 가능하다. 만약 TFA가 크로마토그래피에서 적절한 분리 및 피크 모양 유지를 위해 꼭 필요하면 그 농도를 감소시키는 것도 대안이다. 다른 방법으로는 전처리 과정이나 크로마토그래피 설정을 조정하여 이온화 억제가 일어나지 않는 범위에서 표적 물질이 용출되도록 할 수 있으며, 이온화 억제 현상이 제거되면 대체로 질량분석기의 신호 감도가 좋아진다. 내부표준물질을 포함한 분석물질의 각 m/z 전이(transition)에서 이온화 억제/향상에 의한 영향이 평가되어야 하는데, 크게 추출 후 첨가에 의한 평가법과 컬럼 후 T 주입에 의한 평가법이 있다.
(1) 추출 후 첨가에 의한 평가(post-extraction addition)
LC-MS/MS 방법을 사용하여 혈액, 혈청 또는 소변과 같은 생물학적 기질 내의 약물, 펩타이드, 대사물질 등의 정량분석을 할 때의 회수율은 대개 100%가 아니므로, 회수율의 재현성(reproducibility)을 검증해야 한다. 회수율 감소의 원인은 희석, 추출, 여과 등과 같은 시료 준비 과정 중 손실 때문이기도 하며, 전처리 과정 중 기질 내 내인성 물질이 분석물질이 컬럼과 결합하는 부위와 경쟁할 가능성도 있다. 회수율 및 그 재현성은 다음 3종 세트의 물질을 측정하여 피크 면적을 비교함으로써 평가할 수 있다.
세트 1. 용매에 녹인 순수한 표준물질(neat standard in solvent): water, methanol, acetonitrile, 혹은 이동상에 표준 물질을 첨가한 물질.
세트 2. 빈 기질 검체를 추출한 후에 순수한 분석물질 첨가(pure analyte in blank matrix extracts spiked after extraction): 측정물질이 없는 빈 검체를 추출 과정을 거친 후 세트 1과 같은 양의 표준물질을 첨가한 물질.
세트 3. 빈 기질 검체를 추출하기 전에 순수한 분석물질 첨가(pure analyte in blank matrix spiked before extraction): 세트 1, 2와 같은 양의 표준물질을 첨가한 후 추출 과정을 거친 물질.
세트 1은 용매와 크로마토그래피 시스템 외에 다른 간섭 가능한 요소가 없다. 세트 2와 세트 3에 쓰이는 빈 기질은 최소 6개의 서로 다른 소스에서 유래된 기질을 사용하여 평가할 것을 권장하며, 이를 섞어 혼합하는 것보다는 각 검체를 독립적으로 추출하고 평가하는 것이 중요하다. 이는 각각의 검체별로 기질 효과가 서로 다를 경우에 이를 검출하는 것이 용이하기 때문이다. 최소 2개의 농도에서 최소 5회 이상의 반복 수행을 권장하는데, Matuszewski 등이 기술한 평가 과정에서는 7가지 농도의 검체로 3개의 세트를 각각 5회 반복 측정하여, 총 105 검체를 사용했다[13].
세트 1, 2, 3에서 관찰된 피크 면적을 토대로 다음과 같은 식을 통해 기질 효과(matrix effect, ME)와 추출 회수율(extraction recovery, RE), 과정 효율성(process efficiency, PE) 등을 계산할 수 있다.
ME(%)=100*(B/A), RE(%) =100*(C/B),PE(%) =100*(C/A).
여기서 A, B, C는 각각 세트 1, 2, 3에서 관찰된 피크 면적이다. 내부표준물질을 사용하면 분석물질의 피크면적을 내부표준물질의 피크면적으로 나눈 표준화된 수치도 계산해야 한다. 표준화된 기질효과의 변이계수는 15%보다 커서는 안 되며, 기질효과의 편차는 분석물질의 총 허용오차의 범위에서 평가되어야 한다[4]. 만약 내부표준물질을 사용하였음에도 불구하고 변이계수가 15%를 넘으면, 기질 효과가 검사법 비정밀도에 유의하게 영향을 주는 상태이므로 추가 평가가 필요하다.
(2) 컬럼 후 T 주입에 의한 평가(post-column T infusion)
이 실험에서는 용매에 녹아 있는 분석물질 혹은 내부표준물질을 연속형 주사기 펌프를 이용하여 T자형 연결부위를 통해 질량분석기로 바로 주입한다. 안정적인 총 이온 흐름(total ion current)에 도달하고 분석물질에 대한 일정한 기저선(baseline)을 형성한 후, T자형 연결부위를 통해 기질을 주입하여 분석물질에 대한 기질의 영향을 평가한다. 기질은 실제 분석법과 같은 전처리 및 액체크로마토그래피 분리를 거친 용출액(eluent)이 T자형 연결부위로 주입되도록 한다. 추출 후 첨가에 의한 평가와 마찬가지로, 개별적으로 전처리된 최소 6개의 소스의 빈 기질(blank matrix)을 준비하여 평가할 것을 권한다[3, 4, 7]. 분석물질에 대한 기저선 신호를 모니터링하여 용출액이 질량분석기로 주입된 후 분석물질이 검출되는 정체시간(retention time)에서 총 이온 흐름의 증가 혹은 감소가 관찰되면 기질 효과에 의한 향상 혹은 억제가 있음을 의미한다. 추출 후 첨가법과 달리 정량화가 쉽지 않으나, 피크 높이의 변화를 관찰하여 의미 있는 이온화 향상/억제를 인지할 수 있다. 분석물질 신호의 25% 이상의 감소 또는 증가가 있는 경우, 이온화 억제/향상 효과를 최소화하기 위해 크로마토그래피 설정 혹은 전처리 과정을 수정할 필요가 있다[7]. 이 방법의 단점은 T자형 연결부위를 통한 직접 주입 시에 통상적인 크로마토그래피를 이용한 검사 시의 신호와 비슷한 양의 신호를 주입하는데 기술적인 어려움이 있다는 것이다.
이온화 억제/향상을 줄이는 방법으로서, 내부표준물질로 구조가 유사한 물질을 사용할 경우 분석물질과 내부표준물질이 같이용출되도록 크로마토그래피 설정을 조정할 수 있다. 만약 피크가비슷한 정체시간에 발생하고 내부표준물질이 분석물질과 비슷한이온화 성상을 가진다면, 두 물질의 이온화 억제 정도는 비슷해질것이다. 만약 내부표준물질이 안정한 동위원소로 표지된 경우, 이온화 억제의 정도를 더 정확하게 보정해줄 수 있다.

6) 검출한계와 정량한계(Table 7)

일반적으로 정량하한값은 보정선을 결정하기 위한 보정물질 중가장 낮은 농도, 정량상한값은 보정물질 중 가장 높은 농도로 사용할 수 있다. 정량하한값 이하나 정량상한값 이상의 농도를 보정선에서 산출된 값 그대로 보고하는 것은 권장되지 않는다. 보정선 결정 및 검증에서 다루었듯이, 정량하한값 농도는 변이계수 20% 및 명목값과의 편차 20%를 기준으로 판정하고 정량상한값 농도는 각각 15% 기준으로 판정할 것을 권장한다.
통상 정량적 LC-MS/MS 분석법에서는 신호 대 소음 비(signal to noise ratio)를 기반으로 검출한계와 정량한계를 산출할 수 있다. 5개 이상의 서로 다른 낮은 농도 검체를 준비하여, 분석물질이 검출되는 정체시간에서 신호 강도와 그 외 정체시간에서의 신호 강도를 계산한다. 보통 신호 대 소음 비가 3 이상을 만족하는 농도를 검출한계, 10 이상을 만족하는 농도를 정량한계로 설정할 것을 권장하는데[3], EMEA에서는 분석물질의 정량하한값 농도의 신호가 공시료 신호의 5배 이상일 것을 권고한다[2]. 한편, 보정물질의 반복 측정을 통하여 검출한계를 계산하는 방법도 있는데, 보정선의 y절편 표준편차의 3.3배 값을 기울기평균으로 나눈 값을 검출한계, 표준편차의 10배 값을 기울기평균값으로 나눈 값을 정량한계로 산정하는 방법도 있다[5, 7].
호르몬, 남용 약물, 대사물질과 같이 분석물질의 낮은 농도가 의학적 결정 농도로서 중요한 경우에는 정량한계에 대해 더욱 엄격한 평가가 필요하다. CLSI EP17-A2 에서 권장하는 검출한계, 정량한계의 정의[14] 에는 일반적으로 정밀도의 개념이 포함되며 검증을 위해서는 여러 개의 낮은 농도 검체를 사용한 실험이 필요하다. 검출한계는 공시료, 예상 검출한계 농도 시료를 반복 측정하여 평균과 표준편차를 구해 산출할 수 있다. 정량한계는 검출한계에 가까운 검체를 최소 5개 농도로 연속 희석(serial dilution)하여 준비하고, 이를 반복 측정한 후 비정밀도를 각 농도에서 계산하여 산출한다. 보통 농도가 낮아질수록 비정밀도가 높아지므로, 정량한계는 허용 가능한 비정밀도(변이계수 20% 등)로 측정할 수 있는 최소 농도로 결정할 수 있다.

7) 기타

(1) 안정성(stability)
잠재적으로 불안정한 대사산물을 가진 분석물질의 경우 검체수집 과정 및 검체 보관 기간 중 기질 내 안정성을 확인해야 한다. 검체 내 분석물질의 안정성은 보관 조건, 분석물질의 화학적 성질, 기질 및 용기 시스템의 영향을 받으므로, 안정성 테스트에 적용되는 조건이 실제 검사 수행 시 사용되는 것과 유사해야 한다. 세부적으로는, 장기간 냉동 및 단기간 실온 혹은 냉장 보관, 그리고 냉동 및 해동 사이클을 거친 후, 샘플 전처리 및 분석 전 대기 중에 분석물질의 안정성을 평가해야 하며, 보관용액(stock solution)과 작업용액(working solution)에서의 안정성 평가도 포함되어야 한다. 보관 기간은 실제 검체 분석에 적용되는 기간과 최소한 같은 시간 동안 보관한 후 평가할 것을 권장한다. 안정성 평가 시에는 간섭이 없는 적절한 생물학적 기질에서 새롭게 제조된 보관용액으로부터 준비된 시료를 사용해야 한다. 보통 저농도 및 고농도 정도관리시료를 특정 조건에 저장한 후에 측정하되, 정해진 명목값과 비교하여 ±15% 이내의 오차를 보여야 한다.
단기 안정성 평가는 저농도 및 고농도의 검체를 각각 3개 이상으로 나누어, 실온에서 4-24시간(샘플이 실온에서 보관될 것으로 예상되는 최장 기간) 동안 유지한 후에 분석한다. 단기간 냉장, 냉동 보관될 가능성이 있다면 보관 조건을 실제와 유사하게 조성하여 평가해야 한다. 장기 안정성 평가에서 보관 시간은 실제 검체의 가장 긴 냉동 보관 시간보다 길어야 한다. 단기 안정성과 마찬가지로 저농도와 고농도 각각 3회 이상 검사를 수행할 분량의 정도관리 물질을 보관하여 평가할 것을 권장한다.
일반적으로 작은 분자의 경우 브라케팅(bracketing) 접근법을 적용할 수 있다. 즉 안정성이 -70°C 및 -20°C에서 입증된 경우 중간 온도에서의 안정성을 조사할 필요가 없다. 큰 분자(예: 펩타이드 및 단백질)의 경우 안정성은 검체를 저장할 실제 온도에서 평가할 것을 권장한다. 동결-해동 시 안정성은 최소 3회의 동결 및 해동 주기를 거친 후에 평가한다. 저농도 및 고농도의 검체를 각각 3개 이상으로 분주하여, 설정된 냉동 온도에서 24시간 동안 보관하고 실온에서 해동한다. 완전히 해동되면 같은 조건에서 12-24시간 동안 시료를 다시 냉동한다. 이러한 동결-해동 주기는 두 번 더 반복하거나, 실제 검체 보관 시의 예상되는 동결-해동 수와 같거나 커야 한다. 분석물질 및 내부표준물질의 보관용액에서의 안정성은 실온에서 방치될 수 있는 시간 동안 평가해야 하며, 보관용액이 일정 기간 동안 냉장 또는 냉동되는 경우 이에 대한 평가가 필요하다. 작업용액의 모든 농도에서 안정성을 연구할 필요는 없으며 위에 설명된 브라케팅 접근법을 사용할 수 있다.
마지막으로 전처리된 샘플 내 분석물질 및 내부표준물질의 안정성을 평가하는 경우가 있다. 자동샘플러 내 상주 시간을 포함하여 시료의 주입 전까지의 시간이 평가 대상이며, 실제 이용될 배치 크기와 수행 소요 시간에 따라 전체 예상 검사 시간이 결정되므로 마지막 순서로 검사될 검체에서 분석물질의 안정성을 평가해야 한다. 보통 자동샘플러의 온도를 임의로 설정할 수 있으므로 용매의 증발 및 휘발, 측정물질의 분해 및 변환 등의 인자를 최소화할 수 있도록 하고, 필요한 경우 안정성을 평가한다.
(2) 참고구간(reference interval)
참고구간을 정의하고 측정하는 일반적인 내용은 CLSI C28-A3에소개되어 있다[15]. 질량분석법과 면역측정법의 결과 차이가 30% 이상 나는 것은 드문 일이 아니며, 순수표준물질에서 질량분석법과 면역측정법 결과가 잘 일치하는 경우에도 실제 임상 검체에 적용할 때에는 질량분석법이 면역측정법보다 낮은 농도를 보이는 경우가 있다. 면역측정법은 샘플의 다른 화합물에 대해 약간의 교차 반응성을 갖는 경우가 종종 있는데, 이로 인해 높은 결과를 보일 수 있다[(3]. 따라서 검사법 검증 과정에서 적절한 참고구간 설정에 주의를 기울여야 하며, 기존의 검사법을 질량분석법으로 대체하고자 할 때 새로운 참고구간을 설정해야 한다.
참고구간을 설정하기 위해서는 충분한 수의 자원자 검체가 필요하므로, 통계적으로 적절한 수의 검체를 사용한 다른 출처로부터 참고구간을 참조해올 수 있다. 참고구간을 이전하는 경우 어떤 참고구간을 차용할지 주의해야 하는데, 면역측정법에서의 참고구간을 질량분석법에 그대로 적용하는 것은 매우 위험하다. 방법 간 유사성이 높을수록 참고구간의 참조가 유효할 가능성이 높으므로, LC-MS/MS 방법을 사용하는 기관 간에 참고구간을 인용하는 것이 가장 덜 위험하다. LC-MS/MS 방법이 표준측정법으로 알려져 있으나 특정 분석물질에 따라 다를 수 있으므로 참고구간의 참조는 새로운 참고구간 설정이 가능하지 않은 경우에만 고려되어야 한다.
(3) 잔효(carryover)
LC-MS/MS 시스템에 포함된 검체 주입부(injector), 연결부(line connection and tubing), 컬럼(column), 이온 소스(ion source), 검출기(detector) 등에 분석물질 혹은 간섭물질이 축적될 경우 잔효를 야기하거나 특이성에 영향을 줄 수 있다. LC-MS/MS는 연속적인 흐름(continuous flow)을 통한 측정 시스템으로 무작위 접근(random access) 방식의 측정 기기와는 다르게 검체 잔효의 위험성이 있다. 미국 FDA 지침은 고농도 검체 검사 이후에 하나 혹은 그이상의 공시료를 주입하여 잔효를 평가하도록 하였다[1]. CLSI C62-A는 임상적으로 가장 높은 농도의 검체가 음성 검체에 미치는 잔효가 정량하한값 농도의 25%를 넘지 않도록 권장한다[4]. EMEA는고농도 표준물질 직후에 빈 검체를 검사할 경우 잔효가 정량하한값의 20%를, 내부표준물질의 경우 5%를 넘지 않을 것을 권장하고있다[2]. 만약 잔효를 피할 수 없다면, 잔효가 예상되는 고농도의 검체 직후에는 빈 검체를 추가하여 가급적 환자 검체 결과에 영향을미치지 않도록 한다.
위와 같은 가이드라인에서는 대체로 명확한 실험 프로토콜이나 통계적 판단법을 제시하지는 않고 있다. 국내 검사실에서 흔히 쓰이는 간단한 방법은 고농도 검체 반복 검사 이후 저농도 검체 반복 검사를 연속적으로 실시하여(보통 각각 4회 실시) 첫 번째 저농도 결과값의 편차를 계산하는 것이다. 연속적 유동액체 분석기(continuous flow analyzer) 도입 초창기 문헌에서는 고농도 3회(H1, H2, H3), 저농도 3회(L1, L2, L3)씩 연속 측정한 수행을 통해 잔효([L1-L3]/[H3-L3])를 계산하고 이 수행을 10회 반복하여 평균을 내거나, H1과 H3 평균값을 비모수적paired t-test로 비교할 것을 권하였다[16]. 그 외에도 CLSI EP10-A3에서는 3가지 농도로, 하루 10회씩 5일간 측정하여 얻은 값을 다중회귀분석으로 분석하여 정밀도, 잔효, 비선형성, 유동(drift) 등을 동시에 평가하는 방법도 기술하고 있다[17].
(4) 희석연속성(dilution integrity)
보정선 검증에서 설정한 측정 가능 범위를 벗어난 고농도 검체가 의뢰되는 경우 혹은 소아/신생아 검체와 같이 검체량이 부족한경우, 적절한 기질의 물질을 사용하여 측정 가능 범위 내에 들어오도록 희석할 수 있다. 희석용 기질은 분석물질이 없는 빈 기질(blank matrix)이 선호되나, 정밀도와 정확도에 영향을 미치지 않는 수준에서 다른 기질 혹은 물질도 사용할 수 있다. 희석연속성 검증을 통해 정밀도와 정확도를 평가할 수도 있는데, 이를 위해 분석물질을 첨가하여 정량상한값 이상의 고농도 검체를 준비한다. 실제 검체에서 예상되는 희석 배수(예, 1:2, 1:10, 1:50 등)로 최소 5가지 이상 준비하여 각각 희석 후 희석 배수를 곱하여 농도를 계산하는데, 반복 측정 후 정밀도와 정확도를 계산하여 상대오차 15% 이내, 변이계수 15% 이내 기준을 적용하여 평가할 수 있다[2]. 이를 통해 희석액이 적합한지, 어느 정도의 희석배수까지 허용되는지 판단할 수 있다. 평가 기준을 벗어나는 경우로는 과도한 희석, 부적합한 희석액의 사용, 기질의 영향 등이 있다. 보통 정량하한값의 3배 이하까지 희석하는 것은 권장되지 않는다.

감사의 글

본 연구는 대한임상화학회 임상질량분석연구위원회의 지원에 의하여 이루어진 것입니다.

Notes

이해관계

저자들은 본 연구와 관련하여 어떠한 이해관계도 없음을 밝힙니다.

REFERENCES

1. U.S. Department of Health and Human Services Food and Drug Ad-ministrations. Bioanalytical method validation; Guidance for industry. Center for Drug Evaluation and Research, Food and Drug Administrations;Silver Spring, MD: May 2001.
2. European Medicines Agency, Guideline on bioanalytical method vali-dation. EMEA/CHMP/EWP/192217/2009 Rev. 1 Corr. 2**. https://www. ema.europa.eu/en/documents/scientific-guideline/guideline-bioana-lytical-method-validation_en.pdf. Updated on Jun 2015.
3. Clinical and Laboratory Standards Institute. 2007; Mass spectrometry in the clinical laboratory: General principles and guidance; Approved Guideline. CLSI guideline C50-A. Clinical and Laboratory Stan-dards Institute;Wayne, PA:
4. Clinical and Laboratory Standards Institute. 2014; Liquid chromatography-mass spectrometry methods; Approved Guideline. CLSI guideline C62-A. Clinical and Laboratory Stan-dards Institute;Wayne, PA:
5. International Conference on Harmonisation, Validation of analytical procedures : text and methodology. ICH Guideline Q2(R1). http://www.gmp-compliance.org/guidemgr/files/Q2(R1).PDF. Updated on Nov 2005.
6. Thompson M, Ellison SLR, Wood R. 2002; Harmonized guidelines for single-laboratory validation of methods of analysis (IUPAC technical report). Pure Appl Chem. 74:835–55. DOI: 10.1351/pac200274050835.
crossref
7. Scientific Working Group for Forensic Toxicology. 2013; Scientific working group for forensic toxicology (SWGTOX) standard practices for method validation in forensic toxicology. J Anal Toxicol . 37:452–74. DOI: 10.1093/jat/bkt054. PMID: 23934984.
8. Ministry of Food and Drug Safety. Bioanalytical method validation manual. http://www.korea.kr/common/download.do?tblKey=EDN&fileId=199088. Updated on Jun 2010.
9. Laboratory Medicine Foundation. 2019. Clinical laboratory accreditation checklist for clinical chemistry. Laboratory Medicine Foundation;Seoul:
10. Grant RP, Rappold BA. Rifai N, editor. Development and validation of small molecule analytes by liquid chromatography-tandem mass spectrometry. Tietz textbook of clinical chemistry and molecular diagnostics. 6th ed. Elsevier;St. Louis, MO: p. 326e1–e63.
crossref
11. Clinical and Laboratory Standards Institute. 2003; Evaluation of the linearity of quantitative measurement procedures: A statistical approach; Ap-proved Gguideline. CLSI document EP6-A. Clinical and Laboratory Standards Institute;Wayne, PA:
12. Clinical and Laboratory Standards Institute. 2005; Interference testing in clin-ical chemistry; Approved guideline-Second edition. CLSI document EP7-A2. Clinical and Laboratory Standards Institute;Wayne, PA:
13. Matuszewski BK, Constanzer ML, Chavez-Eng CM. 2003; Strategies for the assessment of matrix effect in quantitative bioanalytical methods based on HPLC−MS/MS. Anal Chem . 75:3019–30. DOI: 10.1021/ac020361s. PMID: 12964746.
crossref
14. Clinical and Laboratory Standards Institute. 2012; Evaluation of detection ca-pability for clinical laboratory measurement procedures; Approved guideline-Second edition. CLSI guideline EP17-A2. Clinical and Laboratory Standards Institute;Wayne, PA:
15. Clinical and Laboratory Standards Institute. 2010; Defining, establishing, and verifying reference intervals in the clinical laboratory; Approved guideline-Third edition. CLSI guideline C28-A3. Clinical and Laboratory Standards Institute;Wayne, PA:
16. Haeckel R. 1988; Recommendations for definition and determination of carry-over effects. J Automat Chem. 10:181–3. DOI: 10.1155/S1463924688000380. PMID: 18925212. PMCID: PMC2547758.
crossref
17. Clinical and Laboratory Standards Institute. 2014; Preliminary evaluation of quantitative clinical laboratory measurement procedures; Approved guideline-Third edition. CLSI guideline EP10-A3-AMD. Clinical and Laboratory Standards Institute;Wayne, PA:

Table 1
Validation parameters specified in each guideline
Parameter FDA, 2001 EMEA, 2011 CIS C50, 2007 CIS C62, 2014 ICH, 2005 IUPAC, 2002 SWGTOX, 2013 KFDA, 2010
Accuracy o o o (bias and trueness) o (trueness) o o (trueness) o (bias) o (정확성
Precision o o o o (imprecision) o o o o (정밀성)
Calibration o o o (standard curve, AMR, and CRR) o (assay calibration and linearity) o (linearity) o (calibration and linearity, and range) o o (보정선)
Selectivity/specificity o o o o o (specificity) o o (interference studies) o (특이성)
Ion suppression, enhancement o (matrix effect) o (minimizing ion suppression) o (matrix effect) o (matrix variation) o o (생체시료효과)
LOD, LOQ o (LOQ) o (LOQ) o o (LOD, LLMI) o o o o (최저정량한계)
Stability o o o o o (안정성)
Reference interval o
Carryover o o o o o (잔효)
Dilution integrity o o o

Parameters with a separate topic and detailed specification were designated as ‘o’. Similar parameters, which are expressed in different terms were described in the parenthesis. Abbreviations: FDA, Food and Drug Administration; EMEA, European Medicines Agency; CLSI, Clinical and Laboratory Standards Institute; ICH, International Conference for Harmonization; IUPAC, International Union of Pure and Applied Chemistry; SWGTOX, Scientific Working Group for Forensic Toxicology; LOD, limit of detection; LOQ, limit of quantification; AMR, analytical measurement range; CRR, clinically reportable range; LLMI, lower limit of measuring interval.

Table 2
Recommended validation procedures and specifications for the clinical application of LC-MS/MS: Accuracy
Guideline Parameter Materials Concentrations Practice Specifications
FDA Accuracy ·Use certified reference materials if possible ·≥ 3 concentrations ≥ 5 determinations per concentration ·Bias < 15% at all concentrations except for the LLOQ (< 20%)
1) Certified reference material (CRM) ·Low, middle, and high QC (3xLL0Q, near the center and near the upper boundary of the standard curve)
2) Commercially supplied reference standards from reputable commercial source ·Include all outliers, but the exclusion of statistically determined outliers is also accepted
3) Other materials of documented purity (synthesized by analytical laboratory or non·commercial establishment)
·Prepared separately from the calibrators
EMEA 1) Within·run accuracy ·CRM or QC sample (samples spiked with known amounts of the analyte) ≥ 4 concentration levels (LLOQ, 3xLL0Q, 30·50% of calibration curve range, at least 75% of the upper calibration curve range) 1) A single run, ≥ 5 samples per level Same as FDA
2) Between·run accuracy ·Prepared independently from the calibration standards using separately prepared stock solutions 2) ≥ 3 runs and ≥ 2 different days
CLSI C50 Bias ·Same as FDA and EMEA NA 1) Compare with the results from an established reference method with known uncertainty NA
Trueness (accuracy of the mean) 2) Analyze sample with a known concentration and compare with its true value
CN C62 Trueness ·Patient specimen > pool of patient specimens > biological matrix·based QC > aqueous non·biological solutions 1) Recovery -3 concentrations 1) 5 replicates if reference materials/methods are not available ·Acceptable criteria: Biological variation, clinical guidelines by expert groups, and local/regional regulatory requirements
·Recommend to use more than one approach 2) Method comparison 2) Preferably > 40 patient samples (EP09)
3) Material with assigned values 3) Each sample measured in duplicate for 3·5 runs (EP15)
ICH Accuracy ·Samples spiked with known amounts of the analyte ·≥ 3 concentrations ·> 9 determinations ·Percentage recovery or difference with confidence intervals
IUPAC Trueness 1) CRM NA NA ·Good recovery is not a guarantee of trueness; poor recovery is an indication of a lack of trueness
2) Reference materials
3) Use of reference method
4) Use of spiking/recovery in the absence of reference materials
SWGTOX Bias ·Pooled fortified matrix samples ·≥ 3 concentrations ·≥ 3 samples per concentration and ≥ 5 runs ·Bias within 20% (for some analytes, less bias is required, ex, blood alcohol within 10%)

Abbreviations: CRM, certified reference material; LLOQ, lower limit of quantification; NA, no applicable descriptions.

Table 3
Recommended validation procedures and specifications for the clinical application of LC-MS/MS: Precision
Guideline Parameter Materials Concentrations Practice Specifications
FDA Precision ∙ Same as FDA in terms of its accuracy parameter ∙ Same as FDA in terms of its accuracy parameter ∙ Same as FDA in terms of its accuracy parameter ∙ CV <15% at all concentrations except for the LLOQ (<20%)
EMEA 1) Within-run precisionx ∙ Same as EMEA in terms of its accuracy parameter ∙Same as EMEA in terms of its accuracy parameter ∙ Same as EMEA in terms of its accuracy parameter ∙ Same as FDA
2) Between-run precision
CLSI C50 1) Repeatability (within-run imprecision) ∙ Samples that closely resemble true patient samples ∙ ≥3 concentrations NA ∙ CV 20% at LOQ
2) Reproducibility (run-to-run imprecision) ∙ Pooled samples of patients preferably taking a drug, ∙ Lower end of the measuring/therapeutic range
∙ Upper end of measuring range
∙ Intermediate point or upper limit of the therapeutic range
CLSI C62 Precision ∙ Pooled samples and spiking of the pure standard ∙ Samples at and within +/-25% of the medical decision point NA CV <15%, <20% at the LLOQ
ICH 1) Repeatability NA 1) ≥6 determinations at 100% of the test concentration ∙ SD, CV, and confidence interval NA
2) Intermediate precision 2) Typical variations include days, analysts, equipment, etc.
3) Reproducibility 3) Inter-laboratory trial
IUPAC 1) Under repeatability conditions: σr ∙ Matrix matched reference materials NA Combined precision [σtot=(σr2/n+σrun2)1/2 NA
2) Under run-to-run conditions: σrun ∙ Difference in the homogenization of the CRM, prepared reference material, and typical test material n=number of the repeat results averaged within a run
SWGTOX 1) Within-run precision NA ∙ ≥3 different samples per concentration at ≥3 different concentration pools (low, medium, and high) over ≥5 different runs 1) Within-run CV (%) = (SD of a single run of samples/mean calculated value of a single run of sample) ×100 ∙ CV <20% A lower CV is required in certain analytes (e.g., blood alcohol CV≤10%)
2) Between-run precision 2) Between-run CV (%)=(SD of a grand mean for each concentration/grand mean for each concentration) ×100 ∙ Use ANOVA approach for calculating within-run and between-run CV
∙ Largest calculated within-run % CV for each concentration will be used

usedAbbreviations: CRM, certified reference material; LLOQ, lower limit of quantification; LOQ, limit of quantification; CV, coefficient of variation; SD, standard deviation; σr, repeatability; σrun, between-run imprecision; NA, no applicable descriptions.

Table 4
Recommended validation procedures and specifications for the clinical application of LC-MS/MS: Calibration
Guideline Parameter Materials Concentrations Practice Specifications
FDA Calibration/standard curve ∙ Biological matrix of the samples in the intended study prepared by spiking with known concentrations of the analyte ∙ Blank sample (matrix sample processed without IS) ∙ Simplest model ∙ 15% deviation of standards
∙ Zero sample (matrix sample processed with IS) ∙ Selection of weighting and the use of a complex regression equation ∙ 20% deviation in the LLOQ from nominal concentration
∙ 6–8 non-zero samples covering the expected range, including the LLOQ ∙ ≥4 out of 6 non-zero standards should meet the above criteria, including the LLOQ and ULOQ
EMEA Calibration curve ∙ Same as FDA ∙ Same as FDA ∙ Single or replicate per each calibration standard ∙ Within 15% and within 20% for the LLOQ
∙ Preferably prepared using freshly spiked samples ∙ Blank and zero samples should not be taken into consideration to calculate the calibration ∙ ≥75% of calibration standards with ≥6 levels must be fulfilled
∙ Using previously prepared and stored calibration samples also available with their stability data ∙ ≥3 available curves should be obtained and reported ∙ In the case of replicates, ≥50% of the repeats tested per level must be fulfilled
∙ The slope and intercept in the linear fitting should be reported
∙ If all replicates of the LLOQ or ULOQ are rejected, the batch should be rejected
CLSI C50 Standard curve NA ∙ 6–8 non-zero samples covering the expected range, including the LLOQ ∙ Linear regression ∙ If important values are on the low end, weighting, the regression line may be used
CLSI C62 Linearity ∙ CRM, solvent-based calibrator ∙ 9–11 points ∙ 2–4 replicates each NA
ICH 1) Linearity ∙ Drug substance (prepared by dilution of a standard stock solution) ∙ ≥5 concentrations covering 80–120% of the test concentration (up to 70–130% for content uniformity) NA ∙ Visual inspection, evaluated using an appropriate statistical method
2) Range ∙ Correlation coefficient, y-intercept, slope, and residual sum of squares
IUPAC Linearity NA ∙ ≥6 concentrations ∙ Duplicate (preferably in triplicate or more), in a random order NA
∙ Evenly spaced over the concentration range ∙ Test for lack of fit using simple or weighted regression
∙ 0–150 or 50–150% of the concentration
SWGTOX Calibration ∙ Matrix matched calibration sample ∙ ≥6 different non-zero concentrations, appropriately spaced ∙ ≥5 replicates per concentration in separate runs over ≥5 runs ∙ Visually evaluated using standardized residual plots (to check for statistically significant outliers)
∙ Fewer calibration samples (fewer levels or single/fewer replicates) may be used for a routine analysis ∙ ≥4 non-zero calibration points including the lowest and highest levels for routine analysis ∙ Simple linear regression using the least squares method or weighted least squares non-linear model ∙ Cannot be evaluated via the correlation coefficient

Abbreviations: CRM, certified reference material; LLOQ, lower limit of quantification; ULOQ, upper limit of quantification; CV, coefficient of variation; SD, standard deviation; NA, no applicable descriptions.

Table 5
Recommended validation procedures and specifications for the clinical application of LC-MS/MS: Selectivity
Guideline Parameter Materials Concentrations Practice Specifications
FDA Selectivity ∙ Appropriate biological matrix from ≥6 sources NA NA ∙ Ensured at the LLOQ
∙ For tissues of limited availability, use appropriate proxy matrices
EMEA Selectivity ∙ Same as FDA Blank NA ∙ ≤20% of the LLOQ for the analyte and ≤5% for the IS
∙ Back-conversions of the metabolite into the parent analyte should be evaluated
CLSI C50 Selectivity ∙ Pure standard material, blank matrix (no material derived from sample) ∙ Baseline biological material (specimen with lowest possible analyte concentration) ∙ Blank, lowest possible concentration ∙ Add analytes and potential interferences NA
Specificity ∙ For endogenous analytes, measure the recoveries in a biological matrix for enrichment with the analyte relative to the baseline biological matrix
CLSI C62 Specificity ∙ Matrix matched double blank sample (no analyte, no IS) ∙ Double blank NA ∙ Background peak <20% of the peak area for the analyte at the LLMI, or ≤5% of the IS at the expected retention time
Selectivity
ICH Specificity ∙ Sample containing analyte ∙ Appropriate level NA ∙ Show that the peak is not attributable to more than one component
∙ Sample not containing analyte
∙ Spiking pure substances with appropriate levels of impurities
IUPAC Selectivity ∙ Calibration, matrix blank, and same blank spiked with potential interferences ∙ One appropriate concentration ∙ Selectivity index=ban/bint; ban=slope of the calibration plot; bint=slope of the response plot with the interferent NA
∙ bint is determined in the blank spiked with the potential interferent in the absence of the analyte
SWGTOX interference studies (1) Matrix interference: Blank matrix samples from ≥10 different sources without the addition of an IS ∙ Blank and ULOQ of the analyte (2) Monitor signal of the analyte when fortified with an IS; monitor the IS when fortified with the analyte (2) Below the LOD when fortified with the IS
(2) IS interference: Blank matrix fortified with an IS, blank matrix fortified with the analyte at the ULOQ without an IS

Abbreviations: CRM, certified reference material; LLOQ, lower limit of quantification; LLMI, lower limit of measurement interval; IS, internal standard; ULOQ, upper limit of quantification; LOD, limit of detection; NA, no applicable descriptions.

Table 6
Recommended validation procedures and specifications for the clinical application of LC-MS/MS: Ion suppression
Guideline Parameter Materials Concentrations Practice Specifications
FDA NA NA NA NA ∙ Ensure precision, selectivity, and sensitivity is not compromised
EMEA Matrix effect ∙ ≥6 lots of the blank matrix obtained from individual donors. ∙ Low and high level (max 3×LLOQ and close to the ULOQ) ∙ MF: Peak area in the presence of the matrix÷peak area in the absence of the matrix. ∙ CV of the IS normalized MF from 6 lots is ≤15%
∙ Pooled matrix should not be used ∙ IS normalized MF: MF of the analyte÷MF of the IS
∙ If the matrix is difficult to obtain, less than 6 different lots may be used
∙ Blank matrix spiked after extraction with the analyte (in the presence of the matrix) and a pure solution of the analyte (in the absence of the matrix)
CLSI C50 Ion suppression ∙ Set 1: Neat standards prepared in a solvent NA ∙ Matrix effect=Set 2/Set 1, ∙ Modify chromatographic conditions so the analyte elutes in a region where ion suppression is not observed.
∙ Set 2: Pure analyte prepared in the blank matrix extracted from 5 different sources (spiked after extraction) ∙ Extraction recovery=Set 3/Set 2
∙ Set 3: Pure analyte prepared in the blank matrix extracted from 5 of the same source (spiked before extraction) ∙ Process efficiency=Set 3/Set 1
CLSI C62 Matrix effects (1) Post-extraction: Same as C50. (1) 5 calibration curves prepared by spiking the analyte post-extraction in 5 different lots of matrix (1) % matrix bias, %CV (1) % matrix bias in the context of total allowable error, %CV of peak area ≤15%
(2) EP7: ≥5 native matrix samples are mixed in several proportions. (2) Linear regression (y=observed concentration and x=expected concentration) (3) The decrease in the total ion current of the direct infusion is measured
(3) T-column infusion: Analyte dissolved in solvent and extracted matrix sample (3) Analyte or IS in solvent directly infused into the MS using a syringe pump and extracted matrix injected concurrently from LC via T-column
ICH NA NA NA NA NA
IUPAC Matrix variation Representative set of matrices Appropriate range Spiking and recovery estimation NA
SWGTOX Ion suppression/enhancement (1) Post-column infusion: ≥10 different processed blank matrix samples. (1) Analyte solutions at low and high concentrations (1) Same as C62 ∙ Average suppression or enhancement ≤25%, CV ≤15%
(2) Post-extraction addition: Same as C50 except ≥10 different sources are required (2) Same as C50 except ≥6 injections to establish the average with duplicate extraction

Abbreviations: LLOQ, lower limit of quantification; CV, coefficient of variation; IS, internal standard; ULOQ, upper limit of quantification; NA, no applicable descriptions.

Table 7
Recommended validation procedures and specifications for the clinical application of LC-MS/MS: LOD and LOQ
Guideline Parameter Materials Concentrations Practice Specifications
FDA LLOQ 5 samples independent of the standards used LLOQ NA ∙ Analyte response at ≥5 × LLOQ compared to the blank sample
∙ CV ≤20%, accuracy 80–120%
EMEA LLOQ NA Same as FDA NA Same as FDA
C50 LOD, LOQ NA NA NA (1) LOD: concentration meets SNR ≥3
(2) LOQ: meets CV 20% or SNR ≥10
C62 LLMI 3–5 different samples Close to the predetermined LOD ≥40 replicates over ≥5 runs Concentration meets the acceptable precision (CV 20%) and trueness (bias 15%) values
ICH LOD, LOQ (1) SNR: Blank samples and samples with known low concentrations. (1) Blank and known low concentrations. (2) SD: calculated using the residual SD of the regression line or SD of the y intercept of the regression line (1) SNR: 2–3 × LOD and 10 × LOQ
(2) SD of the response and slope: An appropriate number of blank samples and specific calibration curve containing the LOD (2) Calibration levels (2) 3.3 × SD÷slope of the calibration curve for the LOD and 10 × SD÷slope for the LOQ
IUPAC LOD, LOQ Blank matrix or low level analyte Blank or low level ≥6 independent determinations LOD: 3 × SD of the replicates
LOQ: CV 10% or 2 × LOD
SWGTOX LOD, LOQ (1) Lowest non-zero calibrator: ≥3 samples of the lowest calibrator (1) Lowest calibrator (1) 3 lowest calibrators per run, 3 runs (1) LOD
(2) Background noise: ≥3 sources of the blank matrix fortified at decreasing concentrations (2) Decreasing concentrations (2) 2 separate samples in ≥3 runs (2) Reproducible ≥3 × background noise signal from the negative sample, or ≥mean+3.3×SD of signal from the negative samples
(3) Linear calibration curve: ≥3 calibration curves (3) Calibration levels (3) ≥3 calibration curves over different runs (3) 3.3×SD of the y intercept÷average slope. LOQ: Acceptable detection, bias, precision criteria in all 3 fortified samples

Abbreviations: LLOQ, lower limit of quantification; LOD, limit of detection; LOQ, limit of quantification; SD, standard deviation; CV, coefficient of variation; IS, internal standard; NA, no applicable descriptions.

TOOLS
Similar articles