안녕하세요.

이번 글에서는 2D 이미지로 사용되는 대표적인 영상이미지인 X-ray와 CT에 대해서 알아보도록 하겠습니다.

 

먼저, X-ray, CT에 대해 간단히 알아본 후, 2D 영상 이미지에서 사용되는 전처리 기법에는 어떤 종류들이 있는지 알아보도록 하겠습니다.

 

아래 영상을 미리 한 번 보시면 글을 읽기 수월 하실 거에요!

 

(↓↓의료 이미지, X-ray, CT, MRI에 대한 간단한 설명)

https://www.youtube.com/watch?v=wbqeIpigxfs 

 

※Medical Imaging이라는 수업에서는 이러한 기기들의 물리적인 작동 방식에 대해서 설명하고 있으나, 여기에서는 단순히 기계의 작동원리나 어떻게 이미지들이 생성되는지만 간단히 알아보도록 하겠습니다.

 

 

 

 

1. X-ray 이미지 (Feat. Digital detector)

X-ray를 이용해 병변을 분류하는 과정은 아래와 같습니다.

 

1) X-ray generator에서 방사선 발사

2) 발사된 방사선이 Object(사람 또는 다른 객체)에 투과

 

이미지 출처: https://en.wikipedia.org/wiki/X-ray_detector

 

3) 사람 내부 인체 조직에 따라 X-ray detector에 있는 image receptor에 투과되는 방서선 양이 다름

 

이미지 출처: https://slideplayer.com/slide/7432411/

Symptom Color
Black Air
Dark gray Fat
Light gray Soft tissues
ex) Water
White Calcification
ex) bone
Whiter Metal

 

 

 

 

4)  투과된 방사선량에 따른 병변 분류

  • 예를 들어, X-ray를 기반으로 폐렴(pneumonia)을 분류한다고 해보겠습니다.
  • 보통 폐렴같은 경우는 X-ray 장비로도 진단을 합니다.
  • 폐렴이 의심되는 환자를 촬영할 땐, image Receptor를 가슴 쪽에 두고 사진을 찍게 되죠. 보통 이러한 사진을 Chest-Xray라고 합니다.
  • 폐는 사람의 호흡과 관련된 기관입니다. 폐를 구성하는 것 중하나는 폐포(alveoli)인데, 여기에서 혈액과 가스의 교환이 이루어집니다. 

이미지 출처: https://kr.freepik.com/premium-vector/human-respiratory-system-lungs-alveoli-medical-diagram-inside-larynx-nasal-throttle-anatomy-breath-pneumonia-smoke-anatomy-illustration-healthcare-and-medicine-infographic_7289256.htm

 

  • 폐렴(Pneumonia)은 공기 중에 떠다니는 있는 세균, 곰팡이 및 바이러스가 체내에 흡입되고 폐포(pulmonary alveoli)에 안착한 후 염증을 일으키면서 발생합니다. 이 과정을 통해 다양한 호흡기 질환으로 합병증이 나타나고 폐 전체에 염증을 일으켜 심각한 결과를 초래하게 됩니다.

 

이미지 출처: https://www.shutterstock.com/ko/image-vector/pneumonia-concept-background-realistic-illustration-vector-1204624771

 

  • 정상적인 폐포의 내부는 기체로 이뤄진 상태이지만 폐렴으로 인해 손상된 폐포에는 염증이 있어 액체 물질로 가득 차 있습니다.
  • 본래 폐포는 공기(기체) 상태인데, 폐렴으로 인해 액체가 폐포에 가득해지면 X-ray 촬영 시, 아래와 같이 X-ray 이미지가 나오게 됩니다. (왼쪽 이미지: 정상(normal), 오른쪽 이미지: 폐렴(pneumonia))

이미지 출처: https://www.bmj.com/content/370/bmj.m2426

 

 

[Q. X-ray 이미지에서 AP, PA는 무엇을 의미하나요?]

Chest X-ray (CXR)를 찍을 때 찍는 방향에 따라 AP(Anterior-Posterior)PA(Posterior-Anterior)로 나눌 수 있습니다.

이미지 출처: https://www.youtube.com/watch?v=iG0gKrXLnpU

Chest X-ray의 경우 찍는 방향에 따라 나오는 X-ray 이미지 상태가 다릅니다.

보통, AP 방식으로 찍기보다 PA 방식을 찍는데 그 이유는 아래와 같습니다. 

  • AP view: 심장이 확대되어 보이며, 견갑골에 의해 폐야가 많이 가려지며, 횡경(Diaphragm)막이 높이 올라가 있어 폐가 좁게 나타남
  • 따라서 COVID-19 선별진료소와 같이 Chest AP에서 얻은 CXR 이미지는 폐 병변을 보기에는 사실 썩 좋지 않은 경우가 꽤 있다. (Dataset 수집할 때 이러한 부분도 고려하면 좋을 듯)

이미지 출처: https://www.slideshare.net/drvikrampatil/approach-to-chest-xray-and-interpretation

  • 위의 그림을 보면 같은 환자인데 Chest AP에서는 심장 size도 크고 그리고 견갑골에 의해서 폐야도 많이 가려지는 형태고 그 다음에 diaphragm도 많이 올라와 있기 때문에 PA와 비교했을 때 상당히 폐야가 좁고, 굉장히 내부의 vessel도 굉장히 engorgement(폐에서의 염증성 충혈)되어 보이는 경우가 많습니다.
  • 이러한 경우, GGO 병변을 딱히 구분할 수 없거나 잘 안보이는 경우가 생길 수 도 있습니다. → 참고로 GGO는 COVID-19에서 발견되는 주요 소견 중 하나입니다.

 

  • 또한, Chest X-ray는 누워서 찍기보단 서서 찍는 것이 좋습니다. 

이미지 출처: https://slideplayer.com/slide/7432411/

 

  • 아래의 환자는 effusion이 있던 환자인데, chest AP 를 누워서 찍으니까 effusion이 전부 뒤로 깔려서 폐 병변을 보기가 상당히 어렵게 됐습니다. 가끔 chest X-ray 데이터셋을 보면 저런 경우를 종종 볼 수 있는데 이런 경우 effusion이 있는 환자가 누워서 찍은건 아닌지 고려한 후 데이터셋을 제거하는 것이 필요할 듯 보입니다.

 

 

(↓↓↓AP, PA에 대한 자세한 설명은 아래 사이트를 참고해주세요↓↓↓)

https://www.radiologymasterclass.co.uk/tutorials/chest/chest_quality/chest_xray_quality_projection

 

Chest X-ray Quality - Projection

Key points Posterior-Anterior (PA) is the standard projectionPA projection is not always possibleBoth PA and AP views are viewed as if looking at the patient from the frontPA views are of higher quality and more accurately assess heart size than AP imagesI

www.radiologymasterclass.co.uk

 

 

 

 

2. CT 이미지

(↓↓CT 가 탄생한 이유↓)

https://youtu.be/xf1eZAp7Mq8

 

X-ray 이미지는 2D로 볼 수 있는 반면, CT는 X-ray generator(source)가 여러 측면에서 촬영하기 때문에 2D 이미지와, 회전을 통해 얻은 이미지들을 이용 (by interpolation ← 몰라도 될 것 같습니다 ㅎ;;) 해 3D 이미지를 얻기도 합니다.  

 

이미지 출처: https://en.wikipedia.org/wiki/CT_scan

 

아래 gif 이미지에서 보이는바와 같이 CT를 촬영하게 되면 360도 촬영을 하게 됩니다.

이미지 출처: https://gifs.com/gif/history-of-computerized-tomography-ct-scanner-vVe5bq

 

위와 같이 촬영을 하면 아래와 같은 축으로 여러 이미지가 나올 수 있죠.

이미지 출처: https://www.pinterest.co.kr/pin/114490015511169070/

 

위의 이미지에 해당하는 축(axis) 마다 다른 형태의 CT 이미지를 출력하게 됩니다.

이미지 출처: https://www.mathworks.com/matlabcentral/mlc-downloads/downloads/submissions/53745/versions/52/previews/html/examples.html

 

COVID-19 데이터 셋을 보면 대부분 Trans-axial(=Transverse)에 해당 하는 축의 이미지들로 구성되어 있습니다.

이미지 출처: https://www.kaggle.com/kmader/siim-medical-images

 

 

폐 위치 관련한 용어를 잠시 보여드리면 아래와 같습니다.

이미지 출처: https://www.researchgate.net/figure/Schema-of-central-and-peripheral-locations-This-diagram-showed-definition-of-central_fig2_279943115

 

이미지 출처: https://epos.myesr.org/posterimage/esr/ecr2010/104360/mediagallery/298132

 

 

(↓↓↓CT 이미지 읽는 장면 아래 영상에서 3:29~3:38 참고↓↓↓)

https://www.youtube.com/watch?v=P6nweaRTiLs 

 

 

아래 사진을보면 정상인, 폐렴, COVID-19 의 폐 CT 사진입니다.

아래 사진을 기반으로 하면 다음과 같이 해부학적으로 병변을 분류할 수 있겠죠.

  • Normal: 깨끗함
  • Pneumonia: 광범위하게 GGO(Ground Glass Opacity)가 퍼져있음
  • COVID-19: peripheral부분에 GGO가 위치하기도 하며, 진행단계에 따라 GGO 정도가 심해지는 consolidation 현상도 볼 수 있습니다.

※ 물론 이것은 아래 사진만 살펴본 예입니다. 실제로 폐렴(pneumonia)은 그 종류가 다양하기 때문에, CT 상에서 보여지는 특징도 굉장히 다양합니다.

이미치 출처: https://www.techscience.com/cmc/v68n1/41834/html

 

 

 

 

3. X-ray, CT 이미지 전처리하기 (Feat. 히스토그램)

전통적으로 사용되는 X-ray 이미지 같은 경우는 앞서 설명한 것처럼 image receptor에 투과된 방사선 양을 토대로 보여지게 됩니다.

 

예전에는 이미지를 필름에 찍어내는 방식을 이용한 X-Ray 검사를 많이 진행했지만,

몇년 전부터는 해당 방사선 양을 직접 전송해 영상화하는 Digital Radiography (DR)을 많이 사용하고 있다고 합니다.

 

 

이미지 출처: http://www.sprawls.org/resources/DIGRAD/module.htm

 

좀 더 구체적으로 설명하자면 아래와 같습니다.

  • receptor는 N×N grid 형태로 있습니다.
  • 각각의 위치는 하나의 pixel이 됩니다.
  • receptor에 exposure된 방사선 양은 analog/digital converter에 의해 픽셀 값을 갖는 digtal image로 변환됩니다.  

이미지 출처: http://www.sprawls.org/resources/DIGRAD/module.htm

 

 

1) Histogram analysis

히스토그램의 여러 어원 중 하나는

'똑바로 선 것'이라는 뜻을 가진 histos에 '그림'을 뜻하는 gram이 합쳐진 합성어라고 합니다.

풀어설명하면 '똑바로 선 막대 그림'이라는 뜻으로 사용되기도 합니다.

 

수학에서 히스토그램은 표로 되어 있는 도수 분포표를 정보 그림으로 나타낸 것입니다.

그렇다면 이미지에서 히스토그램은 무엇을 의미할까요?

 

쉽게 말하자면 이미지 상에 나타난 색상 값들을 도수분포표로 나타낸 것이라고 볼 수 있습니다.

예를 들어, 흑백 이미지에 대한 히스토그램은 아래와 같이 표현 할 수 있습니다.

  • (a) 이미지는 흑백 이기 때문에 X축은 pixel 값 범위 "0~255"로 표현할 수 있습니다.
  • 해당 픽셀 값들이 얼마나 많은지 도수분포표를 통해 나타내면 그것이 이미지 히스토그램입니다.

이미지 출처: https://www.semanticscholar.org/paper/Triad-Histogram-to-Enhance-Chest-X-Ray-Image-Senthilkumar/74557cf53787b0794fb3b6c3207010179abe81d4/figure/0

 

2) X-ray 이미지 전처리(preprocessing) 기법들

2-1) HEQ (Histogram EQualization)

몇몇 “Original(원본)" 이미지는 contrast 가 매우 떨어지는 경우가 있습니다. 

즉, 이미지 픽셀이 0~255에 고르게 퍼져있는 게 아니라, 일부분에 몰려있다는 것을 확인할 수 있죠.

아래 그림을 기준으로 설명하면, "Original" 이미지(→(a) 이미지)에 "Histogram Equalization“ 기법을 적용시킬(→(c) 이미지) 때, 이미지의 contrast 가 증가한 것을 확인할 수 있습니다.

 

"Histogram equalization (HEQ) is a digital image processing technique used for contrast enhancement across a number of modalities in radiology."

HEQ에 대한 수식은 아래와 같습니다.

수식에 대한 직관적인 설명은 여기링크를 참고해주세요! 

 

 

(↓↓↓HEQ Open CV 함수↓↓↓)

https://docs.opencv.org/3.4/d4/d1b/tutorial_histogram_equalization.html

 

OpenCV: Histogram Equalization

Prev Tutorial: Affine Transformations Next Tutorial: Histogram Calculation Goal In this tutorial you will learn: What an image histogram is and why it is useful To equalize histograms of images by using the OpenCV function cv::equalizeHist Theory What is a

docs.opencv.org

 

(↓↓↓HEQ pytorch 함수↓↓↓)

https://pytorch.org/vision/stable/transforms.html

 

torchvision.transforms — Torchvision master documentation

torchvision.transforms Transforms are common image transformations. They can be chained together using Compose. Additionally, there is the torchvision.transforms.functional module. Functional transforms give fine-grained control over the transformations. T

pytorch.org

 

 

2-2) AHE (Adaptive Histogram Equalization)

2-3) N-CLAHE (Contrast Limited Adaptive Histogram Equalization)

 

AHE와 N-CLAHE에 대한 설명은 아래 블로그를 참고하시는게 도움이 되실 것 같아, 따로 설명은 하지 않고 관련 링크를 걸어두도록 하겠습니다.

 

https://3months.tistory.com/407

 

Adaptive Histogram Equalization 이란 무엇인가?

Adaptive Histogram Equalization 이란 무엇인가? Adaptive Histogram Equalization (AHE) 이란 이미지 전처리 기법으로 이미지의 contrast 를 늘리는 방법이다. Histogram Equalization (HE) 방법을 조금 더 개..

3months.tistory.com

 

(↓↓↓ Open CV에서 N-CLAHE 사용 예제↓↓↓)

https://docs.opencv.org/master/d5/daf/tutorial_py_histogram_equalization.html

 

OpenCV: Histograms - 2: Histogram Equalization

Goal In this section, We will learn the concepts of histogram equalization and use it to improve the contrast of our images. Theory Consider an image whose pixel values are confined to some specific range of values only. For eg, brighter image will have al

docs.opencv.org

 

 

이미지 출처: https://www.semanticscholar.org/paper/Triad-Histogram-to-Enhance-Chest-X-Ray-Image-Senthilkumar/74557cf53787b0794fb3b6c3207010179abe81d4

 

 

위의 전처리 방식 외에 Contrast, brightness 등 여러 다른 방식들도 같이 사용될 수 있다는 점 알아두세요!

CT 이미지 또한 X-ray 선을 이용한 것이 때문에 X-ray와 비슷한 전처리 기법이 사용된다는 것을 알아두시면 좋을 것 같습니다~

 

 

 

[전처리를 배우고 딥러닝에 적용해본 후기]

위와 같은 전처리 기법을 딥러닝에 적용했을 때, 유의미하게 CNN 성능이 개선되는 것을 확인할 수 있었습니다.

 

다음 글에서 설명하겠지만, 전처리한 이미지를 segmentation 같은 모델에 적용했을 때 눈에 띄게 향상되는 모습들을 빈번하게 살펴볼 수 있었습니다. 

 

딥러닝 모델 자체에 대한 연구도 중요하지만, 의료 이미지를 다루는 영역에서는 전처리 영역에 대한 테크닉을 적절히 구사할 줄 알아야 한다고 생각했습니다. 즉, 전처리를 적절하게 구사해야 딥러닝 모델의 성능향상을 이끌 수 있을거라 생각합니다.

 

(↓↓↓아래 글에 제가 적용했던 사례들이 있으니 확인해보셔도 좋을 것 같습니다↓↓↓)

https://89douner.tistory.com/256

 

 

 

지금까지 간단하게 X-ray, CT 이미지들과 관련 전처리 기법들을 알아봤습니다.

다음 글에서는 MRI, PET, 초음파, 내시경에서 얻어지는 medical imaging들을 알아보도록 하겠습니다~

 

안녕하세요.

이번 글에서는 왜 COVID-19을 영상학적으로 판단할 필요가 있는지 알아보려고 합니다.

 

먼저, COVID-19이 무엇인지 간단하게 알아보고, 왜 COVID-19을 CT, X-ray 같은 영상이미지에서 찾게 되는지 알아보도록 하겠습니다.

 

 

 

1. COVID-19이 무엇인가요?

2020년 2월 11일 세계보건기구(WHO)는 2019년에 발생한 코로나바이러스 감염증 (Coronavirus disease) 에 대한 공싱명칭으로 COVID-19을 사용하기 시작했습니다. 

 

대부분의 의학논문에서는 Severe Acute Respiratory Syndrome-Coronavirus-2(SARS-CoV-2) 라는 용어를 사용하기도 하는데, SARS-CoV-2와 COVID-19은 동의어라고 보시면 됩니다. SARS-CoV-2라는 용어가 의학적으로 좀 더 직관적인 의미를 나타내기 때문에 종종 논문에서 COVID-19 대신 SARS-CoV-2라는 용어를 사용하기도 합니다. 

 

Severe Acute Respiratory Syndrome-Coronavirus-2 라는 용어는 "코로나 바이러스를 통해 발생하는 급성 호흡 증후군"을 함축적으로 표현한 단어입니다. 그런데 용어를 자세히 보면 Coronavirus-2라는 명칭이 붙었죠? 왜 그럴까요?

 

 

사실 코로나 바이러스는 굉장히 오래전부터 있어 왔습니다. 코로나바이러스는 기원전 8000년경부터 존재했던 오래된 감기 바이러스의 일종입니다. 하지만 이러한 바이러스가 문제가되지 않았던 이유는 해당 바이러스가 같은 종들 사이에서만 전파가 되었기 때문이죠. 예를 들어, 사람들과 사람들 사이에서 전파되는 코로나 바이러스는 인체에 치명적인 영향을 미치진 않았습니다.  

 

이미지 출처: https://www.freepik.com/free-photos-vectors/virus

 

하지만, 코로나 바이러스가 문제되기 시작한건 동물에게 있던 코로나 바이러스가 사람에게 전파되면서 부터 입니다.

 

동물과 동물간에 코로나 바이러스가 전파될 때는 보통 숙주와 중간숙주가 존재하게 됩니다. 예를 들어, 박쥐가 어떤 특정한 코로나 바이러스를 생산해낸 숙주(Natural host)라고 했을 때, 숙주로부터 해당 바이러스가 다른 동물에게 전파됩니다. 이렇게 숙주로 부터 감염된 동물을 중간숙주(Intermediate host)라고 합니다. 그리고, 중간숙주에 있던 코로나바이러스가 유전자 변이를 일으키면서 인간에게 전파됩니다. (아! 참고로 현재(2021.06)까지는 COVID-19의 중간숙주가 무엇인지 명확히 규명되진 않았습니다.)

 

이미지 출처: https://europepmc.org/article/MED/30531947

 

 

앞서 언급했듯이 중간숙주가 보유하고 있는 코로나 바이러스가 유전자 변이를 일으켜 사람에게 전파되는데, 이 때 변이된 코로나 바이러스는 인간의 호흡기관에 굉장한 타격을 줍니다. 여러 호흡기관에서 다양한 증상이 발견되지만 보통은 가슴 부위에 위치한 폐(lung) 기능에 심각한 타격을 입혀 폐 질환으로 야기시킵니다. 이때, 폐나 다른 부위가 심하게 손상되면 호흡에 문제가 생기면서 사망까지 이를 수 있게 하는데, 이러한 개념들을 함축하여 '급성 호흡 증후군 (Severe Acute Respiratory Syndrome)'이라고 합니다.  

 

 

이러한 급성 호흡 증후군을 유발하는 바이러스가 코로나기 때문에 코로나바이러스를 의학적으로 "Severe Acute Respiratory Syndrome-Coronavirus-2"라고 명명하게 됩니다. Coronavirus-2라고 명칭이 붙은것을보면 Coronavirus-1도 있었겠죠?

 

Coronavirus-1 버전의 급성 호흡 증후군은 2002년에 발생한 사스(SARS)입니다. SARS는 SARS-CoV라고 표현되기도 하는데 풀어쓰면 "Severe Acute Respiratory Syndrome Coronavirus"가 됩니다. 또한, 2012년 발생한 메르스(MERS-Cov)도 "Middle East Respiratory Syndrome Coronavirus"라는 뜻으로 중동에서 발견된 코로나 바이러스라는 의미를 지니고 있습니다 (이때 중간숙주가 낙타였죠). 이러한 코로나 바이러스는 동물에게서부터 인간으로 옮겨간 후, 사람들끼리 해당 바이러스를 전파시기게 됩니다 (최근에는 이러한 바이러스가 변이를 일이키며 활동한다고 하죠). 지금까지 말한 코로나 바이러스에 대한 개념을 정리하면 아래와 같습니다.

 

  • 동물에게서 발생한 코로나 바이러스가 인간에게 넘어가면 문제가 된다.
  • 보통 폐 기능에 타격을 입해 호흡관련 문제를 일으키기 때문에 "호흡 증후군(Respiratory Syndrome)"이라는 명칭이 붙는다.
  • 해당 바이러스는 2002년에 보고되었고, 최근 2020년부터 인류에 엄청난 피해를 주고 있다.
    • 사스(SARS): 2002년 보고된 SARS-CoV() 코로나 바이러스로 인해 발생한 증상으로 이름을 붙였다.
    • 메르스(MERS): 2012 MERS-CoV() 중동에서 발견돼서 Middle East라고 이름을 붙였다.
    • 코로나(COVID 19): 2019 SARS-CoV2(COVID-19) 발생연도에 의해 이름이 붙여졌다.

 

(↓↓↓코로나란 무엇인가?↓↓↓)

https://www.youtube.com/watch?v=RJDroTVhP3c 

 

 

 

 

 

2. 왜 COVID-19을 영상학적으로 판별하려고 하나요?

현재 COVID-19을 판별하는 보편적인 방식(Golden standard)은 Reverse-Transcription Polymerase Chain Reaction (RT-PCR)입니다. RT-PCR은 사람들의 DNA를 채취해 코로나 바이러스 확진 유무를 판별합니다. 많은 국가들이 이러한 진단방식을 채택하고 있지만, 이러한 진단방식에도 분명 단점이 존재하죠. 

 

이미지 출처: https://www.freepik.com/free-vector/how-pcr-test-works_8511053.htm

 

(↓↓↓RT-PCR 진단 프로세스↓↓↓)

https://www.youtube.com/watch?v=REoaZK6YMUM 

 

 

2-1) 첫 번째 문제는 정확도입니다.

  1. RT-PCR의 문제점을 지적하는 부분중 하나는 낮은 sensitivity 성능 지표입니다.
  2. Sensitivity(=TP/(TP+FN))가 낮다는 것은 FN(False Negative)가 높다는 것을 의미합니다.
  3. False Negative가 의미하는 바는 실제 COVID-19 환자에게 음성이라고 (=COVID-19이 아니라고) 진단한 케이스인데, 감염질병에 있어서 FN이 높다는 것은 굉장한 문제가 됩니다.
  4. 왜냐하면, 실제 COVID-19 환자가 안심하고 여러 사람을 접촉하면서 바이러스를 전파시킬 확률이 매우 높기 때문이죠. 
  5. RT-PCR에서 대상을 FN으로 판별하는 경우는 아래와 같습니다.
    • 이전에 음성으로 반단했지만 반복검사 끝에 양성으로 바뀐 경우
  6. 이러한 환자들 중 몇몇은 이미 CT를 통해 이상소견을 발견하기도 했다고 합니다. 

 

(↓↓↓FN 외에 다른 성능지표가 궁금하시다면↓↓↓)

https://89douner.tistory.com/253

 

1. 의료 인공지능에서 사용하는 대표적인 지표들 (1) - TP, FP, TN, FN, and Confusion matrix

안녕하세요 이번에는 의료 인공지능에서 사용하는 대표적인 지표들에 대해서 소개하려고 합니다. 사실 머신러닝을 공부하신 분들이나, 의학통계를 공부하신 분들은 다들 알고 있을 개념이지만

89douner.tistory.com

 

(↓↓↓자가검사키트의 문제점↓↓↓)

https://www.youtube.com/watch?v=EtbYtK0FW7I 

 

(↓↓↓CT기반 COVID-19 판독↓↓↓)

https://www.youtube.com/watch?v=VQ-IwfsMstI 

[정확성에 대한 개인적인 견해]

의료영상 데이터를 기반으로 한 딥러닝 COVID-19 진단 모델 논문들을 읽어보면 대부분 RT-PCR의 낮은 성능지표(sensitivity)를 문제삼고 있습니다. 즉, 딥러닝 모델은 sensitivity 지표 뿐만 아니라 다른 지표들에서도 기존 RT-PCR 보다 성능이 좋다는 점을 주장하고 있습니다.

 

하지만, 딥러닝 모델을 기반으로 COVID-19을 분류 해보니 정확성이 높다고 이야기 하기에는 좀 더 검증해봐야 할 부분이 있다고 보였습니다. 예를 들면 아래와 같은 것들입니다.

  1. X-ray, CT 이미지 상태에 문제는 없는지 (ex: 해당 이미지에 너무 많은 artifact가 있는건 아닌지)
  2. Internal validation과 external validation이 제대로 구축된 상태에서 진행이 된건지
  3. 딥러닝 모델이 결과적으로 옳게 분류했으나, 타당한 소견으로 분류를 한건지

이러한 부분들은 딥러닝 관련 연구 부분을 설명할 때 더 자세히 언급하도록 하겠습니다.

 

 

 

2-2) 두 번째 문제는 진단을 위해 소요되는 시간입니다.

  1. 보건복지부에 따르면 RT-PCR은 진단시 2일 정도 되는 시간이 필요하다고 규정하고 있습니다.
  2. 최근에는, 실시간(realtime) RT-PCR 방식 또는 자가검사키트를 이용해 빠르게 확진결과를 알아볼 수 있다고 하는데, 실제 관련 논문들을 보면 정확도에 심각한 문제가 발생하는 경우가 있습니다. 즉, 시간의 장점을 취한대신 정확성을 조금 포기 한거라고 볼 수 있는데, 만약 정확성이 많이 떨어진다고 한다면 해당 진단방식을 이용하는건 문제가 될 수 있습니다.

 

[시간에 대한 개인적인 견해]

 X-ray, CT 기반의 딥러닝 모델을 이용해야 한다는 논문들을 보면 RT-PCR보다 빠른 진단을 할 수 있다는 점을 강조합니다.

 

하지만, 이 부분은 상황별로 분리해서 봐야 한다고 생각합니다. 예를 들어, 사람 한명을 기준으로 봤을 때는 당연히 X-ray, CT를 기반으로 판독하는게 시간이 빠르겠죠. 하지만, X-ray, CT 촬영은 장비의 수가 제한적이기 때문에, 환자가 늘어나면 촬영 시간이 굉장히 길어질 것입니다. 즉, 진료대상이 만명이 된다고하면 RT-PCR 방식이 더 빠르다고 할 수 있겠죠. 

 

(↓↓↓영상학적 진단 방식이 시간적인 측면에서 문제가 될 수 있는 경우↓↓↓)

https://www.youtube.com/watch?v=jEP0hZtWGr8 

 

또한, 딥러닝 모델을 사용한다는 측면에서 보면, 당연히 컴퓨터가 빠르게 진단해주기 때문에 시간을 절약할 것이다라고 볼 수 있습니다. 하지만, 보통 딥러닝 모델은 의사들의 진단을 보조해주는 보조진단 도구 (CAD: Computer Aided Diagnosis)로 활용되기 때문에  RT-PCR에 비해 진단시간이 짧다고 볼 순 없습니다. 즉, 최종 결정은 의사가 하기 때문에, 기존의 의사들의 진단 속도를 높여줄 수는 있을지 몰라도, RT-PCR 보다 빠른 진단을 할 수 있다고 주장하는 것은 현실적으로 모순이 될 수 있습니다. 

 

만약, 딥러닝 모델로 진단했을 때, 정상일 확률이 낮은 경우에만 의사들이 해당 데이터를 진단하게 해준다면 진단시간을 획기적으로 줄일 수 있겠죠. 즉, 방대한 양의 데이터를 초기 스크리닝 또는 필터링을 해줌으로써 진단속도를 높일 수 있습니다. (실제 이러한 스크리닝 기법은 google healthcare에서 발표한 "A deep learning system for differential diagnosis of skin diseases"와 같은 논문에서도 도움이 될거라고 언급하고 있죠)

 

결국 의료영상 데이터를 기반으로 COVID-19를 분류한다는 논문을 작성할 때, 기존 RT-PCR 보다 빠르기 때문이라고 하는 주장할 때는 좀 더 구체적인 상황을 가정해야하지 않나 싶습니다. 

 

 

 

2-3) 세 번째 문제는 RT-PCR을 사용하기 위해서는 많은 비용을 요구합니다.

  1. Nature에 실린 "The explosion of new coronavirus tests that could help to end the pandemic"논문 중 일부를 인용하자면, RP-PCR 진단 키트를 생산하기 위한 설비(facilities)를 갖추는 건 상당한 비용을 요구한다고 합니다. 기존에 이러한 연구가 활발히 진행되는 선진국들은 기본적인 설비가 이미 갖춰져 있었겠지만, 그렇지 않은 나라에서 이러한 설비를 설치하고 모든 국민에게 제공한다는 것은 경제적으로 큰 부담이 됩니다. 
  2. 또한, RT-PCR을 진단하기 위해서는 잘 훈련된 인적자원들이 필요합니다. 진단 과정에서는 "환자의 DNA를 검출 → 해당 DNA를 운반 → 도착한 DNA 정보 분석"과 같은 과정이 포함됩니다. 진료소에 배치되어 있는 인원들, 환자의 DNA 정보를 운반하는 인원들, 해당 데이터를 분석하는 인원들은 모두 잘 훈련된 사람이어야 합니다. 이러한 인원들의 인건비나 진단과정에서 발생하는 간접비용(운반비용, 진료소에 있는 의료진 방호복 등)은 RT-PCR 진단 프로세스가 상당한 비용을 요구한다는 것을 보여줍니다
  3. 최근에는 진단비용이 CT 촬영비용과 비슷하게 나온다는 견해가 있어서 진단비용까지 부담이 되고 있습니다.

https://www.youtube.com/watch?v=-lcdWy3VPOs

 

[비용과 관련한 개인적인 견해]

사실 설비와 관련된 문제를 따지면 CT, X-ray 같은 촬영장비를 설비비용도 적지 않다는 것을 알 수 있습니다. 만약, 이러한 장비를 설치해야 한다면 막대한 비용이 들기 때문에 "RT-PCR이 비용이 많이 들어서 영상이미지 기반의 진단을 해야한다"고 이야기하는 것은 모순이 될 수 있습니다.

 

 그렇기 때문에, 몇 가지 상황을 가정하고 이야기를 하는 것이 더 맞다고 생각합니다. 예를 들어, 이미 CT 같은 장비들은 대학병원에 구비가 되어 있는 상태이고, 지역근처의 2차병원에서도 구비가 되어 있습니다. X-ray 같은 장비들은 동네병원에서도 구비가 되어 있죠. 그래서, 기존 장비들을 재활용할 수 있기 때문에 새로운 시설을 만들 필요가 없을 수 있죠. 또한, 영상의학적 보조진단 software 프로그램을 사용하게 되면 진단 프로세스가 "환자 X-ray or CT 촬영 → software 프로그램 → 진단"과 같이 진행되기 때문에 중간 과정을 획기적으로 줄여줄 수 있다는 장점이 있을 겁니다. 이러한 부분들을 통해 COVID-19을 진단하는데 발생하는 총 비용이 RT-PCR보다 적다는 자료가 있다면, 영상학적 진단을 사용해야 하는 경제적인 이유가 될 수 있겠죠.

 

 

 

2-4) 네 번째 문제는 불안전성 입니다.

  1. 선별 진료소 의료진들의 코로나 감염사례가 증가하고 있습니다. RT-PCR 진단 방식을 위해서는 환자와 대면을 해야하기 때문에 의료진들이 위험에 노출 될 수 밖에 없습니다.
  2. 사실 방호복을 입고 진료를 한다고 하지만, 업무가 과중되거나 갑자기 처리해야 할 일이 많아지면 정신이 없기 때문에 자신도 모르게 마스크를 내릴 수 도 있습니다. 한 여름에는 더욱 심하겠죠.
  3. 결국, 비대면으로 실내에서 진단할 수 있는 방법을 생각하지 않을 수 있습니다. 

 

[안정성과 관련한 개인적인 생각]

 개인적으로는 "영상의료 기반의 딥러닝 기술을 사용해야 한다"는 주장을 하려고 했을 때, 안정성과 정확성에 대한 이유가 이러한 주장을 가장 잘 뒷받침해줄 수 있는 근거가 아닌가 싶습니다. 

 

 

 

COVID-19을 진단할 때 RT-PCR를 대체할 수 있는 방식으로 영상학적인 진단기술이 주목받고 있지만, 앞서 개인적인 견해에서 밝혔듯이 문제점 또한 존재 합니다.

 

하지만, 이러한 문제점들이 개선 된다면 영상학적 진단 방식은 더욱 주목을 받을거라 생각합니다. 그리고, 딥러닝이나 그 외 인공지능 기술들이 이러한 단점을 빠르게 개선시켜줄 것이라 기대하고 있습니다.

 

다음글에서는 딥러닝 기반 COVID-19 연구를 설명하기 전에 실제 영상학과에서는 어떤 기준으로 COVID-19을 진단하는지 알아보도록 하겠습니다!

 

 

 

 

 

 

 

 

 

+ Recent posts