
SK텔레콤은 오픈소스 커뮤니티 허깅페이스(Hugging Face)에 독자 구축 거대언어모델(LLM)인 ‘A.X(에이닷 엑스) 3.1’을 24일 공개했다.
340억 개(34B)의 매개변수를 기반으로 하는 ‘A.X 3.1’은 SK텔레콤이 언어모델의 제일 처음 단계부터 모두 구축하는 프롬 스크래치(From Scratch) 방식으로 모델 구축과 데이터 학습 등 전 단계를 직접 진행했다.
이번에 공개한 A.X 3.1은 A.X 3.0의 대폭 개선된 버전이다. 한국어 대화 성능에 집중했던 A.X 3.0과는 달리 A.X 3.1에서는 추론모델로의 확장 가능성을 고려해 코드와 수학성능을 대폭 향상시켰다.
SK텔레콤은 이번에 프롬 스크래치 방식의 A.X 3.1 모델 2종(표준, 경량)과 대규모 학습(Continual Pre-Training, CPT)에 기반한 A.X 4.0 모델 2종(표준, 경량)까지 총 4개의 모델을 오픈소스로 공개했다. 해당 모델은 학술 연구나 상업 이용 등에 자유롭게 활용 가능하다.
A.X 3.1(34B)은 자사 A.X 4.0(72B)와 비교할 때 절반 이하의 매개변수로 구성됐지만, 같은 한국어 서비스에 적용될 경우 약 90% 수준의 성능을 발휘한다. 사용자들은 A.X 3.1과 4.0 중에서 사용 환경에 더 적합한 성능과 효율을 고려해 선택할 수 있다.
A.X 3.1(34B) 모델은 대표적인 한국어 능력 평가 벤치마크인 KMMLU(Measuring Massive Multitask Language Understanding in Korean, 한국어 대규모 다중과제 언어 이해 평가)에서 ‘A.X 3.1’(69.20)는 ‘A.X 4.0’(78.3) 대비 88% 수준을 확인했고, 한국어 및 한국 문화 벤치마크인 CLIcK(Cultural and Linguistic Intelligence in Korea)에서는 ‘A.X 3.1’(77.1)가 ‘A.X 4.0’(85.7) 대비 90% 수준의 성능을 기록했다.
SKT는 그동안 확보한 우수한 LLM 기술 역량을 바탕으로 과학기술정보통신부가 주관하는 ‘독자 AI 파운데이션 모델 사업’에 지원했다. SKT 컨소시엄은 반도체, 모델, 데이터, 서비스로 이어지는 독자 기술 기반의 풀스택 AI를 구현하고, 개발하는 모델을 국내 AI 생태계의 다양한 기업들에 오픈소스로 개방하는 것을 목표로 하고 있다.
컨소시엄에는 게임사 크래프톤, 모빌리티 데이터 분야 포티투닷, 추론형 AI반도체 제작사 리벨리온, 지식·정보 검색에 특화된 AI 에이전트인 라이너, AI 모델의 데이터 안정성 확보 기술을 갖춘 셀렉트스타 등 다양한 회사들과 서울대 및 KAIST 연구진 등이 참여한다.
SKT 컨소시엄이 만들 AI 모델을 사용하기로 의향서를 낸 업체 중에는 SK하이닉스와 SK이노베이션, SK AX, SK브로드밴드, SKT 주도 K-AI 얼라이언스에 참여 중인 몰로코(AI광고), 씨메스(제조AI), 가우스랩스(제조AI), 스캐터랩(감성AI) 등이 포함됐다. 참여 의향서 제출 기업은 추후 더 늘어날 전망이다. SKT 컨소시엄은 자체 개발 LLM인 A.X와 각 참여사가 보유한 자체 LLM 및 데이터 등에 기반해 국내 대표하는 독자 파운데이션 신규 모델을 만들 계획이다.
또 초거대 AI 모델 개발에 도전해 텍스트뿐와 이미지, 음성, 비디오 등 다양한 형태의 데이터를 통합적으로 처리할 수 있는 ‘옴니모달(Omni-Modal)’ 기술을 적용할 예정이다. 이와 함께 AI 업계의 표준으로 자리 잡은 트랜스포머 구조를 넘어서는 혁신적인 신규 구조 연구도 추진해 글로벌 AI 경쟁에서 대한민국만의 독자적인 기술 경쟁력을 확보할 계획이다.
김태윤 SK텔레콤 파운데이션 모델 담당은 “각 분야 선도기업들과의 컨소시엄 구성으로 향후 소버린 AI 분야에서 새로운 성과를 만들 것”이라며 “국내 AI 생태계를 종합적으로 고려해 혁신적인 인공지능 모델을 선보일 계획”이라고 밝혔다.