
[쿠키뉴스] 송금종 기자 = KT ‘AI 원팀’이 다자간 공동연구로 초거대 AI 모델을 개발한다. 초거대 AI는 대용량 연산이 가능한 인프라를 바탕으로 대규모 데이터를 학습해 사람처럼 스스로 사고하도록 설계된 인공지능이다.
초거대 AI 언어모델은 매우 빠르게 발전하고 있으며 데이터 정제·학습 알고리즘·분산병렬학습·경량화·응용모델 발굴 등 분야별 연구가 필요하다. 단일 기업이 단독으로 추진하기 어렵고 학교와 연구기관은 AI 연구를 위한 대규모 GPU(그래픽처리장치) 인프라에 접근하기도 쉽지 않다.
KT AI 원팀은 기업 대규모 투자로 GPU 인프라를 구축하고 학교와 연구기관은 최신 연구 동향을 반영한 기술을 제공하는 이상적인 산·학·연 협력 모델을 적용한다.
KT는 18일 AI원팀 참여기관인 한국전자통신연구원(ETRI)·카이스트·한양대와 ‘초거대 AI 모델’ 개발 공동연구 협약을 맺었다. 프로젝트는 기관별 자연어 처리 분야 국내 최고 연구진으로 구성됐다.
AI 원팀은 초거대 AI 모델 확보를 대한민국 AI 경쟁력 확보를 위한 핵심 의제로 설정하고 약 6개월 이상 실무 논의와 협력을 지속해 왔다. 이번 협약으로 기관별 역할을 정의하고 프로젝트 수행에 본격 나선다는 계획이다.
KT는 다른 참여기관들과 힘을 모아 대규모 GPU 인프라 구축·데이터 수집분석·모델 학습·응용태스크 적용 등 연구개발과 상용화 업무를 총괄한다.
카이스트는 머신러닝 알고리즘 최적화와 어플리케이션 파트를 맡는다.
한양대는 데이터 정제필터링 알고리즘 개발·분산병렬 알고리즘과 모델 최적화 분야에 힘을 보탠다. ETRI는 대형 모델학습과 모델개발 분야에 참여한다.
AI 원팀은 연내 1차로 초거대 AI 학습을 완료하고 내년 상반기 초거대 AI모델을 상용화를 목표로 삼았다.
대규모 AI 연산 인프라를 구축하고 2000억 파라미터(매개변수) 이상 모델까지 가능하도록 인프라 규모를 확대한다.
AI 원팀 연구진은 학습데이터 필터링 강화·데이터 간 균형 조정으로 AI 편향성을 우선 제거한다. 유해 콘텐츠 필터링 기술 등 다양한 딥러닝 기반 탐지 기술을 활용해 AI 윤리이슈도 미리 차단한다.
이번에 개발하는 초거대 언어모델은 즉시 상용화가 가능한 과제 지향적 형태로 설계된다.
언어모델로 향상된 STT(음성인식)·TTS(음성합성)·TA(텍스트 분석)·대화 등 요소기술은 KT 기가지니와 AICC 서비스 고도화를 위해 먼저 쓰인다.
제조·금융·물류·유통 등 AI 원팀 참여기업 다양한 사업 분야에도 적용된다.
AI 원팀은 영상·로봇 등 복합인지·이미지 기반 해석·휴머니스틱 AI(인간중심 AI) 등에서 초거대 AI 모델로 영역을 확장한다.
국내외 기업과 학교·연구기관이 AI 원팀 초거대 모델을 활용해 한국어 언어지능에 손쉽게 접근하고 다양한 산업분야에 활용하도록 지원할 계획이다.
이윤근 ETRI 인공지능연구소장은 “ETRI가 보유한 한국어 AI기술인 엑소브레인 원천기술을 보다 발전시켜 초거대 언어모델 프로젝트에 적용해 한국어처리 분야 AI기술주권 확보에 기여하겠다”고 밝혔다.
홍경표 KT융합기술원장은 “AI 원팀 소속기관이 보유한 세계 수준 기술과 경험을 모두 결집한 초거대 AI모델 개발은 차세대 AI 핵심 원천기술 확보라는 측면에서 각별한 의미를 가진다”며 “이번 프로젝트로 대한민국 국가 AI 산업 경쟁력 강화에 크게 기여하고 산업전반 디지털 전환과 고객 라이프스타일 변화를 선도하겠다”고 밝혔다.
AI 원팀은 지난해 2월 ‘대한민국 AI 1등 국가’를 목표로 출범했다.
KT·ETRI·카이스트·한양대·현대중공업그룹·LG전자·LGU+·한국투자증권·동원그룹·우리은행 등 10개 산·학·연 기업과 기관이 참여하고 있다. AI 인재양성·Open R&D·AI Eco 강화 등을 위해 힘을 모으고 있다.
song@kukinews.com