
국내 연구자들이 지난해 발표한 생물의학 분야 논문 가운데 약 5편 중 1편은 챗GPT와 같은 대형언어모델(LLM)의 도움을 받은 것으로 분석됐다.
8일 과학기술계에 따르면 독일 튀빙겐대학교의 드미트리 코박 박사 연구팀은 최근 15년간 발표된 생물의학 논문 초록에서 생성형 인공지능(AI)의 활용 흔적을 추적한 연구 결과를 국제학술지 ‘사이언스 어드밴시스’에 게재했다.
연구팀은 미국 국립의학도서관(NLM)이 운영하는 데이터베이스 ‘펍메드’에 2010년부터 2024년까지 등재된 논문 1천500만 건의 초록을 대상으로 LLM이 선호하는 어휘의 비율을 분석해 사용 여부를 가늠했다.
분석 결과, ‘delves’(조사하다), ‘underscores’(강조하다) 같은 드물게 쓰이는 표현부터 ‘potential’(가능성), ‘findings’(조사 결과) 등 LLM이 자주 사용하는 단어 454개가 2024년 들어 급격히 증가한 것으로 나타났다.
이러한 단어 사용 빈도를 토대로 추산한 결과, 지난해 초록 작성에 LLM을 활용한 비중이 전체의 13.5%에 이른다고 연구팀은 설명했다.
국가별로 보면 영어권인 영국과 호주에서는 사용 비율이 약 5%에 그친 반면, 한국·중국·대만 등 비영어권 국가는 20%로 상당히 높은 수치를 기록했다.
연구팀은 비영어권 연구자들이 LLM을 영어 교정 도구 등으로 실용적으로 활용하는 경향이 강하며, 영어권의 경우 추천 문장을 수정해 흔적이 덜 남을 가능성이 있다고 해석했다.
학술지에 따른 차이도 뚜렷했다. ‘네이처’, ‘사이언스’, ‘셀’ 등 최상위 학술지에서는 LLM 이용 비율이 7% 정도였으나, ‘네이처’ 자매지는 10%, 스위스 출판사 MDPI가 발간하는 학술지에서는 21%로 높아 ‘저널의 질’과 LLM 사용 빈도가 반비례하는 경향이 나타났다.
특히 MDPI의 ‘센서스’에 실린 한국 연구 논문은 34%가 LLM으로 작성된 흔적이 확인돼 매우 높은 수준이었다.
연구팀은 LLM이 생물의학 논문에 미친 영향이 코로나19 이후 변화보다 더 크다며, 이런 확산에 대응해 과학계가 정책과 규정을 재정비해야 한다고 강조했다.
한편 학계에서도 AI 도구의 활용이 빠르게 증가하고 있지만, 이를 둘러싼 윤리적 기준과 규제는 아직 초기 단계에 머물러 있다.
국제학술지 ‘네이처’가 연구자 5천229명을 대상으로 실시한 최근 설문조사에서, 응답자의 90%는 논문 편집이나 번역에 생성형 AI를 사용하는 것을 수용할 수 있다고 답했다. 다만 55%는 AI 사용 사실을 명시하거나 별도의 확인 절차가 필요하다고 응답했다.
논문 초록에 AI를 사용하는 것에 대해선 33%만이 금지해야 한다고 밝혔으며, 45%는 사용 사실을 밝힌다면 허용할 수 있다고 했다. 23%는 명시 없이도 사용이 가능하다고 답했다.
또 실제로 논문 작성 과정에서 AI를 활용해봤다고 밝힌 연구자는 전체의 28%에 그쳐, 아직 대다수는 AI 이용에 신중한 태도를 보이는 것으로 조사됐다.