스타트업 ‘업스테이지’ 구축 나서
게티이미지뱅크 생성형 인공지능 챗봇 서비스 ‘아숙업’을 운영하는 스타트업 ‘업스테이지’가 우리말을 잘 구사하는 인공지능을 찾기 위한 평가 순위표 개발에 나선다. 업스테이지는 한국지능정보사회진흥원와 협업해 개방형 거대언어모델의 성능을 평가하는 ‘리더보드’를 함께 만든다고 5일 밝혔다. 업스테이지는 한국지능정보사회진흥원이 운영하는 인공지능 학습용 데이터 제공 플랫폼 ‘에이아이허브’에 축적된 다양한 분야의 한국어 데이터를 활용해, ‘오픈코 엘엘엠 리더보드’를 이달 중 구축할 계획이다. 한국지능정보사회연구원은 2025년까지 1300여종의 데이터를 구축하는 것을 목표로 의료, 교통 등 다양한 분야 데이터를 에이아이허브에 수집·가공해, 이를 인공지능 개발자들에게 무료로 배포하고 있다.
그동안 개방형 거대언어모델 성능 평가에는 국외 머신러닝 스타트업 ‘허깅페이스’가 만든 리더보드가 주로 쓰였다. 허깅페이스는 인공지능 개발자들이 코드와 언어모델, 데이터 세트 등을 오픈소스로 공유하는 플랫폼을 운영해, ‘인공지능계의 깃허브’라고도 불린다. 업스테이지 관계자는 “허깅페이스는 추론 능력, 상식, 언어 이해력, 환각 방지 등 네 가지 지표를 갖고 거대언어모델을 평가하지만, 영어를 구사하는 모델만 평가가 가능하고 한국어를 비롯한 다른 언어모델은 평가가 불가능하다”고 한국형 리더보드의 필요성을 설명했다. 업스테이지는 한국어 거대언어모델 리더보드에 허깅페이스가 쓰는 네 가지 지표 외에 윤리, 전문가 지식 등 추가 지표도 활용할 예정이다. 정인선 기자 [email protected] 관련기사 연재인공지능과 함께 살아가기 항상 시민과 함께하겠습니다.
대한민국 최근 뉴스, 대한민국 헤드 라인
Similar News:다른 뉴스 소스에서 수집한 이와 유사한 뉴스 기사를 읽을 수도 있습니다.
“늘품신문이 슈즈아틀리에보다 더 친근해요”어린이체험관 속 우리말 7우리말로 바꾸니 이해 빨라져국립국어원이 공모 통해 선정업사이클링은 우리말로 ‘새활용’팩토리의 순화어는 ‘공방, 공장’
더 많은 것을 읽으십시오 »
[자막뉴스] '말로 표현할 수 없을 정도로 엄청납니다'...몽골에 부는 K 바람2009년부터 한국어 수업을 운영 중인 후레톨가 고등학교....
더 많은 것을 읽으십시오 »
함양에서 차 한잔? 직접 재배한 삼도 맛볼 수 있습니다산삼&커피 정수환 대표 "산양삼 가공 개발, 다양한 시도 중"
더 많은 것을 읽으십시오 »
[단독]“김만배, 100억 출연해 ‘신학림 이사장’ 언론재단 설립 계획”···검찰, 대장동 관계자 진술 확보화천대유자산관리 대주주 김만배씨가 거액을 출연해 대장동 개발 사업에 도움될 언론재단을 만들고...
더 많은 것을 읽으십시오 »
내 회사 기밀로 남 AI 키울라…데이터 전쟁, 새 규칙 필요해하정우 네이버클라우드 AI 이노베이션센터장은 팩플에 '해외 빅테크 기업이 한국어 데이터를 제약 없이 학습에 활용하는 것을 막아야 한다'며 '국내 데이터가 해외에도 공유되면 국내 AI 경쟁력은 약화될 것'이라고 말했다. ◦ ‘인형 눈알 붙이기’는 그만 : 정부는 지난달 기존의 ‘데이터 라벨링 AI 학습용 데이터’ 정책을 ‘초거대 AI 학습용 데이터 구축’으로 전환하겠다고 발표했다. 오픈AI 등 글로벌 빅테크는 AI 학습에 활용한 데이터셋을 공개하지 않는데, 업계에서는 이들 선두 기업들이 ‘개인정보보호법이나 저작권법 위반 소지가 있는 데이터로 학습을 마쳐 모델을 고도화했을지 모른다’라고 의심한다.
더 많은 것을 읽으십시오 »