KT, 'KSAFE-MM'으로 한국 문화 이해하는 AI 가려낸다

IT·게임

모바일

카테고리 내 검색

KT, 'KSAFE-MM'으로 한국 문화 이해하는 AI 가려낸다

서재창 기자 ㅣ chang@chosun.com

등록 2026.06.16 16:43 / 수정 2026.06.16 16:44

목록으로

1만4135개 샘플로 젬마·하이퍼클로바 X 등 글로벌 AI 12종 검증
전세 사기, 독도 분쟁 등 한국 고유 이슈까지 반영한 모델 별도 구성

KT 직원들이 KSAFE-MM을 개발 중인 모습. /KT 제공

KT가 한국 사회 정서와 문화적 맥락을 기준으로 인공지능(AI)의 안전성을 가려내는 벤치마크를 16일 내놨다. 빅테크의 대형언어모델(LLM)이 한국에서만 통용되는 민감한 이슈에 안전하게 대응하는지에 대한 잣대가 만들어진 셈이다.

KT는 고려대학교와 공동 개발한 멀티모달 LLM 안전성 평가 벤치마크 'KSAFE-MM'을 공개했다. KSAFE-MM은 두 축으로 구성된다. 해외에서도 공통적으로 다뤄지는 위험 요소를 한국적 정서에 맞게 재구성한 'KSAFE-MM-G', 전세 사기나 독도를 둘러싼 영토 분쟁처럼 한국 사회에서만 통용되는 민감한 이슈를 따로 담은 'KSAFE-MM-C'다.

두 데이터셋은 멀티모달 AI 모델의 안전성을 한국 사회 이슈와 문화적 맥락을 반영해 평가하도록 설계됐다. 전체 평가 문항은 1만4135개에 달한다. 국내에서 구축된 한국어 멀티모달 안전성 데이터셋 가운데 가장 큰 규모로, 구글의 젬마와 네이버의 하이퍼클로바X를 포함한 글로벌 AI 모델 12종의 안전성을 실제로 검증하는 데 쓰였다.

기존에는 이런 안전성 벤치마크를 만들 때 사람이 일일이 위험 문항을 골라내고 검증하는 수동 방식이 표준이었다. 전문가가 직접 데이터를 선별하고 검수하는 방식이 주를 이뤄 비용과 시간이 많이 소요됐다는 게 업계의 오랜 지적이었다.

KT와 고려대 연구진은 이 과정을 통째로 자동화했다. 먼저 지역 커뮤니티에서 통용되는 민감한 주제를 자동으로 수집한 뒤 이를 바탕으로 질문을 만든 뒤 합성 이미지를 생성했다. 끝으로, AI 안전장치나 윤리적 제한을 교묘하게 우회하는 탈옥 질의까지 만들어내는 4단계 구조를 취했다. 특정 문화권에 대한 전문 인력 없이 현지 맥락을 반영한 안전성 평가 체계를 신속하게 구축한다는 게 이번 연구의 골자다.

박재형 KT AX미래기술원 프론티어 AI 랩장은 이번 벤치마크에 대해 "AI 안전성 연구 생태계 전반이 함께 발전하는 기반을 만드는 일"이라고 밝혔다. 그는 KSAFE-MM이 학계와 산업계에서 한국어와 한국 문화 맥락의 AI 안전성을 검증하는 공통 기준으로 자리 잡길 기대한다고 덧붙였다.

IT·게임

KT, 'KSAFE-MM'으로 한국 문화 이해하는 AI 가려낸다

최신기사

최신 뉴스 더보기

산업 최신 뉴스 더보기

많이 본 뉴스