생명과학 분야에서 Agentic AI의 가능성은 그 어느 때보다 커지고 있습니다. 제약회사, 규제 대응팀, 임상 연구 기관들은 이제 단순히 정보를 제공하는 수준을 넘어, 인사이트를 종합하고 의사결정을 지원하며 실제 업무까지 수행할 수 있는 자율형 AI 에이전트 도입에 속도를 내고 있습니다.그러나 화려한 벤더 발표나 PoC(개념검증) 데모 뒤에는 보다 복잡한 현실이 존재합니다. 실제로 신약 개발 환경에서 제대로 작동하는 Agentic AI를 구축하는 일은 쉽지 않습니다. 이는 단순히 대규모 언어모델(LLM)을 연결하는 수준이 아니라, 모델의 한계를 이해하고 데이터 구조를 재설계하며 규제 산업에서의 생산성 개념 자체를 다시 정의해야 하는 작업이기 때문입니다.
클래리베이트는 제약 인텔리전스 플랫폼과 AI 기반 워크플로우를 구축하는 다양한 고객들과 협업하며, 다음과 같은 다섯 가지 핵심 교훈을 확인했습니다.
1. 추론 능력이 필요한 영역에서는 모델 선택이 중요합니다.
모든 대규모 언어모델(LLM)이 동일하게 만들어진 것은 아닙니다. 특히 생명과학 분야에서는 그 성능 차이가 더욱 뚜렷하게 나타납니다. 규제 가이드라인 문서를 해석하거나, 새롭게 도입되는 약물감시(pharmacovigilance) 요구사항에 맞춰 기업의 약물 포트폴리오를 매핑하거나, 서로 다른 데이터 소스에서 경쟁 인텔리전스를 종합적으로 분석하는 작업은 진정한 다단계 추론 능력을 필요로 합니다. 이러한 업무에서는 단계적 사고(chain-of-thought reasoning)에 최적화된 모델들이 다른 모델들보다 일관되게 뛰어난 성능을 보이며, 그 차이는 단순한 수준이 아니라 결정적이라고 할 수 있습니다.
실제 현장에서는 이는 곧 모델 선택이 단순한 범용 제품 구매가 아니라 전략적 의사결정이라는 의미입니다. 기본 기능이 비슷해 보인다는 이유로 가장 저렴하거나 익숙한 모델을 선택한 조직들은, 논리가 복잡하고 위험 부담이 크며 오류 허용 범위가 사실상 없는 중요한 순간에 AI 에이전트가 제대로 작동하지 않아 실망하는 경우가 많습니다. 가장 까다로운 Agentic AI 업무에는 최상위 추론 성능을 갖춘 모델을 활용하고, 상대적으로 단순한 정보 추출이나 포맷팅 작업에는 경량 모델을 사용하는 방식이 일관되게 더 우수한 결과를 만들어내는 패턴으로 확인되고 있습니다.
2. LLM은 백과사전 처럼 활용해서는 안되며, 잘하는 일에 활용해야 합니다.
초기 Agentic AI 구축 과정에서 가장 자주 발생하는 아키텍처상의 실수 중 하나는 언어모델 자체를 지식 저장소처럼 사용하는 것입니다. LLM은 추론 능력에 매우 뛰어난 기술입니다. 방대한 정보 속에서 패턴을 찾아내고, 논리를 자연스럽게 연결하며, 구조화된 문장을 생성하는 데 강점을 보입니다. 반면, 제약 관련 사실 정보나 규제 선례, 임상시험 결과와 같은 내용을 정확하게 보관·제공하는 역할에는 상대적으로 한계가 있습니다. 학습 데이터에는 시점의 한계가 존재하고, 일부 편향이나 불완전한 정보가 포함될 수 있기 때문입니다. 특히 규제가 중요한 산업에서는 잘못 생성된 참고문헌이나 최신성이 반영되지 않은 의약품 정보가 단순한 오류를 넘어 규제 제출이나 비즈니스 의사결정에 영향을 미칠 수 있습니다.
효과적인 AI 아키텍처는 ‘지식’과 ‘추론’을 분리하는 데서 시작됩니다. 정형 제약 데이터베이스, 규제기관 자료, 검증된 임상시험 등록 데이터와 같은 신뢰 가능한 정보원을 기반으로 데이터를 제공하고, LLM은 그 정보를 바탕으로 내용을 이해하고 분석하며 결과를 정리하는 역할을 수행해야 합니다. 이러한 검색 기반(Retrieval-Augmented) 접근 방식은 환각(hallucination)을 크게 줄이고, 결과의 신뢰성과 검증 가능성을 높여줍니다. LLM은 뛰어난 분석가와 같습니다. 중요한 것은 그 분석가에게 얼마나 정확하고 신뢰할 수 있는 자료를 제공하느냐입니다.
3. 정형 데이터는 조용하지만 강력한 경쟁 우위가 될 수 있습니다.
비정형 텍스트(PDF, 규제 문서, 학술 출판물 등)를 중심으로 작동하는 Agentic AI 시스템은 속도가 느리고 비용이 많이 들며, 정보 추출 과정에서 오류가 발생할 가능성도 높습니다. AI 에이전트가 질문에 답하기 위해 매번 문서를 직접 해석해야 할 경우, 더 많은 토큰 사용과 지연(latency)이 발생하고 정보 오해의 위험도 커집니다. 반면, 표준화된 필드를 기반으로 정리된 약물 데이터, 통제된 용어 체계에 매핑된 임상시험 데이터, 유형과 국가별로 태깅된 규제 조치 정보처럼 정 제약 데이터를 구축해온 조직들은 훨씬 빠르게 인사이트를 도출하고, 추론 비용도 의미 있게 절감하는 성과를 보이고 있습니다.
여기서 중요한 교훈은 데이터 인프라가 AI 여정을 시작하기 위한 필수 조건은 아닐 수 있지만, 규모가 커질수록 가장 큰 병목 요소가 된다는 점입니다. 정형 데이터를 핵심 자산으로 관리해온 조직들은 AI 에이전트가 광범위한 전략적 질문에서 구체적인 수치 기반 답변까지 몇 초 만에 전환할 수 있도록 지원합니다. 반면, 문서 중심 환경에 의존하는 조직들은 실제 인사이트 도출보다 정보 추출 과정에 더 많은 시간을 소비하게 됩니다. 앞으로 Agentic AI 워크플로우가 더욱 고도화될수록, 가장 정제되고 정형화된 데이터를 보유한 조직들이 지속적으로 더 큰 경쟁 우위를 확보하게 될 것입니다.
4. 파인튜닝이 예전만큼 해답이 될 수 없습니다.
몇 년 전까지만 해도 제약과 같은 전문 분야에 AI를 적용할 때의 일반적인 접근 방식은, 독점 데이터를 활용해 기본 모델을 파인튜닝(fine-tuning)하는 것이었습니다. 당시에는 범용 모델들이 추가 학습 없이 전문 영역의 업무를 충분히 수행하기 어려웠기 때문에 이러한 방식이 합리적이었습니다. 하지만 지금은 상황이 크게 달라졌습니다. 최신 최상위 모델들은 과거에는 상상하기 어려웠을 정도로 폭넓은 과학·규제·임상 지식을 기본적으로 갖춘 상태로 제공되고 있습니다. 이런 모델을 약간의 성능 향상을 위해 다시 파인튜닝하는 것은 오히려 불안정성을 높이고 유지관리 부담을 키우는 경우가 많습니다. 특히 기본 모델이 업데이트될 때마다 파인튜닝 작업도 다시 검토해야 하기 때문에 비용과 운영 복잡성이 빠르게 증가하게 됩니다.
최근에는 모델 자체를 수정하기보다, 프롬프트 엔지니어링(prompt engineering), 검색 기반 아키텍처(retrieval architecture), 그리고 정교한 시스템 지침(system instructions)에 투자하는 방식이 훨씬 효과적인 접근으로 평가받고 있습니다. 즉, 모델의 가중치를 변경하는 대신, 어떤 데이터와 맥락을 제공하느냐를 통해 전문성을 구현하는 것입니다. 선별된 컨텍스트, 정형 데이터, 명확한 지침은 모델이 보다 정확하고 일관된 결과를 생성하도록 돕습니다. 물론 파인튜닝이 완전히 사라진 것은 아닙니다. 특정한 문체를 유지해야 하거나, 대규모 반복형 데이터 추출처럼 고도로 정형화된 작업에서는 여전히 유효한 활용 사례가 존재합니다. 다만, 전문 분야 적응(domain adaptation)을 위한 기본 전략으로서의 역할은 상당 부분 다른 접근 방식으로 대체되고 있는 추세입니다.
5. 고객은 이제 인사이트가 아닌 ‘실행’을 원합니다.
제약 인텔리전스 시장에서 고객의 기대는 조용하지만 매우 근본적으로 변화하고 있습니다. 불과 1년 전만 해도 잘 정리된 규제 영향 분석 보고서나 경쟁 환경 리포트를 제공하는 것만으로도 높은 가치의 AI 결과물로 평가받았습니다. 하지만 이제 고객들은 단순히 정보를 제공받는 데서 그치지 않고, AI 에이전트가 그 인텔리전스를 실제 업무로 연결해주기를 기대하고 있습니다. 예를 들어 규제 제출 초안을 작성하거나, 영향을 받는 제품을 시스템에서 식별하고, 검토 회의를 일정에 등록하며, 프로젝트 트래커를 업데이트하는 것까지 AI가 수행하기를 원하는 것입니다. 즉, 인텔리전스와 워크플로우 실행 사이의 경계가 점차 사라지고 있습니다.
이러한 변화는 Agentic AI 아키텍처 자체를 다시 생각하게 만듭니다. 단순히 정보를 검색하고 요약하는 데 초점이 맞춰진 시스템은 이제 실제 행동을 수행할 수 있는 기능까지 확장되어야 합니다. 여기에는 API 연동, 문서 생성 파이프라인, 업무 관리 시스템 연결 등이 포함되며, 동시에 규제 산업 특유의 컴플라이언스 및 정확성 리스크를 관리하기 위한 적절한 human-in-the-loop 체계도 함께 갖춰져야 합니다.처음부터 ‘실행’을 중심으로 시스템을 설계한 조직은, 단순 정보 제공 도구에 나중에 실행 기능을 덧붙이려는 조직보다 훨씬 앞서 나가게 될 것입니다. 앞으로 생명과학 분야 AI의 다음 단계를 정의하게 될 에이전트는 단순히 질문에 답하는 시스템이 아니라, 실제 업무를 끝까지 연결하고 완료하는 시스템입니다.
생명과학 분야의 Agentic AI 시대는 이제 막 다가오고 있는 것이 아닙니다. 이미 실제 운영 환경에서 활용되고 있으며, 실질적인 가치와 교훈을 만들어내고 있습니다. 가장 빠르게 학습하고 발전하는 조직들은 초기 AI 구축 과정의 한계를 솔직하게 인정하고, 다음 세대 시스템을 보다 제대로 설계하는 데 집중하는 조직들입니다.높은 수준의 모델 품질, 신뢰 가능한 데이터 기반, 구조화된 데이터, 가볍고 효율적인 아키텍처, 그리고 실행 중심의 설계는 더 이상 이상적인 원칙이 아닙니다. 이러한 요소들이 실제로 제약 산업의 워크플로우를 혁신하는 AI 에이전트와, 인상적인 데모만 보여줄 뿐 실질적인 가치는 만들지 못하는 시스템을 구분하는 핵심 기준이 되고 있습니다.
클래리베이트의 기술 컨설팅 서비스가 고객의 기술 역량 최적화를 어떻게 지원하는지 자세히 알아보세요.