최종 수정 일시 2024-10-02, 오후 6:17여러 인공지능(AI) 챗봇이 저마다 비슷한 능력을 갖고 있다고 자랑합니다. 실제로 각각의 성능을 측정하고 우위를 비교하려면 어떻게 해야 할까요? 거대언어모델(LLM)을 만들고 연구하는 국제 학계와 전 세계 개발자 커뮤니티에서는 표준화된 데이터 세트를 이용해서 개념적으로 잘 정의된 작업의 성능을 계량, 측정하고 그 점수를 비교하는 방식을 쓰고 있습니다. 이런 성능 비교 방식은 논문을 통해 …
Readings matter. Writings matter more.
최종 수정 일시 2024-10-02, 오후 6:17여러 인공지능(AI) 챗봇이 저마다 비슷한 능력을 갖고 있다고 자랑합니다. 실제로 각각의 성능을 측정하고 우위를 비교하려면 어떻게 해야 할까요? 거대언어모델(LLM)을 만들고 연구하는 국제 학계와 전 세계 개발자 커뮤니티에서는 표준화된 데이터 세트를 이용해서 개념적으로 잘 정의된 작업의 성능을 계량, 측정하고 그 점수를 비교하는 방식을 쓰고 있습니다. 이런 성능 비교 방식은 논문을 통해 …