약물 재창출, Real World Data 및 인공지능/머신러닝: 관점과 기회

AIDA ARCAS 박사
바이오인포매틱스 컨설턴트
클래리베이트

 

De-novo 약물 발굴 및 개발과 관련된 파이프라인은 시간과 비용이 많이 소모됩니다. 신약을 발견해서 시장에 출시하기까지 최장 17년, 약 20억달러 이상의 비용이 소요되기도 합니다. 임상시험을 거친 De-novo의약품 중 최종 승인을 받는 비율은 10%에 불과할 정도로 실패율도 높으며, 임상 1상과 2상(안정성, 내약성, 용량, 효능 및 부작용 평가)에서 가장 높은 실패율을 보입니다.

약물 재창출 접근법은 이미 시판 중 이거나 사람에 대한 안정성 평가를 통과한 의약품을 선별하는 것을 목표로 하며, 약물의 초기 개발 목적과 다른 질환을 치료하는 데 활용될 수 있습니다. 이것의 가장 중요한 이점은 치료를 기다리는 환자들에게 효과적인 치료제를 보다 빨리 제공할 수 있다는 점입니다.

기존의 신약개발 접근법과 비교했을 때 무시할 수 없는 또 다른 약물 재창출 접근법의 장점은, 제약회사들의 신약개발 투자수익률을 높일 수 있다는 점입니다. 약물 재창출 접근법을 사용하면, 비용이 5억달러 이상 감소해 기업의 R&D예산에 큰 영향을 미칠 수 있습니다.

 

인실리코(In-silico) 방식, 머신러닝 빅데이터

과거에 성공을 거둔 약물 재창출 사례는 주로 우연히 발생했습니다. 하지만, 요즘의 약물 재창출은 보다 방법론적이며 대부분 인실리코 방식으로 이루어집니다. 계산 방법은 분자 도킹 및 결합부위 감지에서 경로 매핑, 유전자 연관 및 머신러닝에 이르기까지 다양합니다.

클래리베이트 DTS 컨설팅 부서의 Ezequiel Anokian 바이오인포매틱스 컨설턴트는 최근 웨비나를 통해 빠르게 변화하고 있는 머신러닝 기반 기술에 초점을 맞추어 일련의 방법을 설명했습니다.

Anokian 은 “대체로 머신러닝 기반 약물 재창출 방법은 4가지로 분류됩니다. 기존의 머신러닝, 네트워크 기반, 행렬분해 모델 및 딥 러닝이 그것입니다.”라면서 “최근에는 이들 중 딥 러닝 모델이 인기를 끌고 있습니다.”고 말했습니다.

  • 기존의 머신러닝 방법: 관찰된 샘플(예, 약물-질환 페어링)과 특징(약물, 대상 및 질병 속성)을 기반으로Random Forest나 Support Vector Machines과 같은 전통적인 모델을 훈련시킵니다.
  • 네트워크 기반 방법(Network-based approaches): 노드가 생물학적 엔티티(예: 약물, 질병 또는 단백질)이고 엣지가 그들 간의 직접 또는 간접적인 연결을 나타내는 네트워크(그래프) 구조로 구성된 데이터에서 작동합니다. 이 범주에 속하는 유명한 알고리즘 중 하나는 Random Walk입니다.
  • 행렬 분해 모델(Matrix Factorization models): 네트워크를 나타내는 행렬(예: 인접 행렬)을 더 작은 행렬로 분해하는 방식으로 작동합니다. 이 분해 과정은 원래 행렬의 근사값을 얻도록 하며, 이를 통해 누락된 연결을 대체하거나 예측하는 데 사용됩니다. 행렬 분해 알고리즘은 소셜 네트워크와 추천 시스템에서 널리 사용됩니다.
  • 딥 러닝 모델(Deep Learning models): 입력 데이터의 추상화를 학습하는 많은 숨겨진 레이어로 구성되어 있습니다. 약물 재창출에서 일반적으로 사용되는 인코더-디코더 모델의 경우 다음과 같이 작동합니다: 인코더 부분은 대상의 입력 아미노산 서열 또는 화합물의 SMILES를 임베딩 공간으로 인코딩하고, 디코더 부분은 입력 대상과 약물 간의 결합 점수를 예측합니다.

Anokian 은“컴퓨터 약물 재창출 도구는 데이터의 품질과 일관성에 의해 큰 영향을 받습니다. 클래리베이트에서는 질병 바이오마커 정보를 추출하기 위해 질병 바이오마커 정보를 추출하기 위한 Cortellis Drug Discovery Intelligence (CDDI™), 단백질 간의 상호작용을 위한MetaBase™, 약물 안정성 및 유해이벤트 정보를 위한 OFF-X™ 의 세가지 독점 데이터베이스를 활용합니다. 수동으로 큐레이션 된 정기적으로 업데이트 되는 이 데이터베이스는 강력한 워크플로우의 주요 축 중 하나입니다.”라 말했습니다.

또한, Real-World Data (RWD)는 기존의 무작위 대조시험을 보완할 수 있으며 빠르고 경제적이며, 엄격한 포함기준이 적용되지 않아 보다 큰 표본 크기와 더 긴 후속기간을 가질 수 있다는 장점이 있습니다. RWD는 희귀질환 분야에서 약물 재창출을 대폭으로 지원할 수 있습니다.

규제환경

새로운 적응증 치료를 위해 기존 약물의 용도를 변경하려고 할 경우, 행정업무 부담이 경감될 수 있습니다. 예를 들어, 인체에 안전한 것으로 입증된 약물(즉,성공적으로 1상 임상시험을 통과한 약물) 이 일반적으로 우선적으로 처리되기 때문에, 임상시험용 의약품 단계는 생략될 수 있습니다.

클래리베이트DTS컨설팅 부서의 Martí Bernardo-Faura수석 바이오인포매틱스 컨설턴트는 “그러나,  약물 재창출은 규제에 있어 여러가지 문제에 직면해 있기도 합니다.”라 지적하면서 “예를 들어 미국에서는 FDA가 이전에 승인된 의약품을 새로운 적응증에 적용하는 것에 대해 3년의 배타적 데이터 사용 기간을 제공합니다. 그러나, 대부분의 경우 3년이라는 시간은 한 회사가 의약품 용도를 변경하기 위해 투자한 비용을 회수하기에는 충분한 기간이 아닙니다.”라 말했습니다. 또한, 용도가 변경된 제네릭 의약품을 라벨 외의 용도로 사용할 경우(Off-label use) 제품의 가치가 더욱 떨어질 수도 있습니다.

규제 기관들이 약물재창출 컨셉에 대해 보다 개방적으로 대응함에 따라, 보다 간소화되고 덜 제약적인 규제 경로를 제공하게 되었습니다. 희귀질환 및 희귀 질환 치료제와 연관이 깊은 이 분야에서 보다 적은 행정적 부담과 투자수익증가가 기대됨으로 인해 이 분야의 연구개발 활동이 촉진될 것으로 기대됩니다.

신규 비즈니스 모델

웨비나를 통해 Anokian과Bernardo-Faura는 협력적인 신규 비즈니스 모델의 설립이 약물 재창출을 증가시키는 데 핵심이 될 것이라고 언급했습니다. 클레리베이트는Algorithm Benchmarking (ABC)과 Computational Biology for Drug Discovery (CBDD)의 2가지 구독기반 사전 경쟁 컨소시엄을 이끌고 있으며, 여기서 클래리베이트는 약물 발굴 및 개발에 직접 적용되는 첨단 경로 및 네트워크 분석 알고리즘을 벤치마크 하고 구현합니다.

업계 리더들과 혁신가들 간의 협력은 의약품 발굴과 개발을 촉진하고 강화하는 데 핵심적인 역할을 합니다. 클래리베이트는 최근 미국 생물의학 첨단 연구개발국(BARDA)과 협력하여 염소가스나 머스터드가스 부상을 치료하기 위한 약물 재창출 프로젝트를 수행했습니다.

약물 재창출의 방법, 과제 및 관점에 대해 보다 자세히 알고싶으신 분들은 이곳을 눌러 관련 웨비나를 시청해 보시기 바랍니다.