인공지능(AI) 기술의 활용 가능성에 대한 기대와 관심이 한국에서 광범위하게 형성되고 있습니다. 행정안전부가 대국민 서비스를 모바일 기기에서 간편한 인증 절차만으로 제공하고 필요한 정보를 챗봇 대화 방식으로 제공하는 공공 AI 비서 앱 ‘구삐’가 대표적입니다. 구삐는 2021년 상반기 출시되었는데, 코로나19 사태 당시 전 국민 대상으로 운영된 백신 접종 예약 확인, 사전안내, 주의사항과 이상반응 대처 방안, 차수별 접종 안내를 도우면서 많은 국민들의 건강을 챙겼습니다. 구삐 챗봇은 이후 전자통관을 비롯한 10종 이상의 대국민 상담 업무를 맡고 있습니다. 행안부가 특허청과 협업해 지식재산권 10개 분야와 과련된 질의응답을 구삐에 탑재하고 특허고객상담센터나 국민비서 챗봇 웹사이트에서 대국민 지식재산권 간편문답까지 할 줄 알지요.
대국민 AI 비서 챗봇인 구삐를 개발한 기업은 한국 AI 업체인 솔트룩스입니다. 구삐가 등장하기 전에도 솔트룩스는 2016년 EBS 장학퀴즈에 퀴즈 AI인 ‘엑소브레인’을 출전시켜 수능 만점 득점자인 인간을 상대로 퀴즈 대결에서 우승하는 기록을 남겼습니다. 2023년 9월에는 자체 개발한 ‘루시아GPT(LUXIA GPT)’라는 AI 언어모델을 공개했고 매개변수 70억개 버전을 시작으로 연내 매개변수 1000억개를 다루는 버전까지 선보일 계획이라고 발표했습니다. 이경일 솔트룩스 대표는 아마존웹서비스와 협력해 글로벌 시장을 공략하고 자회사 플루닛과 함께 AI 가상인간 직원 서비스 ‘플루닛 워크센터’ 등을 선보여 수익 기반을 다각화하기로 했어요. 솔트룩스는 앞서 구삐를 출시함으로써 우리나라 정부의 대국민 행정 효율을 한 단계 끌어올리는 데 기여했는데요. 이제 국내뿐 아니라 해외에서 AI 기술을 둘러싼 관심도가 높고 민간 기업용 AI 기술에 대한 투자가 늘어나고 있다고 판단해 이를 공략하겠다고 예고한 셈입니다.
실제로 윤석열 대통령은 2023년 9월 제20차 비상경제민생회의를 주재하면서 “초거대 AI를 둘러싼 각국의 주도권 경쟁이 치열한 가운데, 우리 기업들 역시 독자적인 초거대 AI를 연이어 출시하고 있다”고 진단했습니다. 이 자리의 다른 이름은 ‘대한민국 초거대AI 도약’ 회의였는데요. 우리나라가 디지털 모범국가로 나아가기 위해 AI 경쟁력을 향상시키고 신뢰성을 강화할 방안을 민간 기업과 정부 기관이 함께 모색하기 위한 공간으로 마련되었죠. 윤 대통령은 초거대 AI를 비롯한 강력한 디지털 기술의 특성이 국경 없는 연결성과 즉시성에 있다고 보고, 국제적으로 통용되는 보편적 디지털 질서가 정립돼야 한다고 강조하기도 했습니다. 이는 초거대 AI 등장에 앞서 데이터를 분석하고 기계를 훈련해 가치 있는 결과를 창출하는 ‘빅데이터’와 ‘머신러닝’ 기술의 시대가 도래했다는 이야기가 나올 때와는 사뭇 달라진 분위기를 드러냅니다. 초거대 AI, 특히 인간의 언어 능력을 흉내낼 수 있는 거대언어모델(LLM) 기반의 강력한 AI 서비스가 등장하면서 일어난 변화라고 볼 수 있습니다.
전 세계는 이제 빅데이터, 머신러닝 기술을 이용하면서 LLM과 같은 막대한 영향력을 발휘할 수 있는 AI 기술의 효과가 과거와 다른 양상을 띤다는 점에 주목하고 있습니다. 이를테면 생물의 다양성을 보호하거나 사회 빈곤층을 구제하고, 취약계층을 보호 및 지원하거나 식량 부족과 같은 세계 문제를 해결하는 데 활용할 수 있다는 점은 더욱 긍정적인데요. 각국 사례를 소개해 드립니다.
정부 정책 접근성 높여라…MS가 만든 인도판 구삐 ‘주갈반디’
마이크로소프트(MS)는 인도 정부가 지원하는 OpenNyAI, AI4Bharat 같은 현지 기업들과 협력해 ‘주갈반디(Jugalbandi)’라는 챗봇을 개발했습니다. 주갈반디는 MS의 클라우드 서비스를 기반으로 이 회사가 투자한 LLM 기업 오픈AI(OpenAI)의 기술을 제공하는 ‘마이크로소프트 애저 오픈AI 서비스’를 활용하는데요. 이 챗봇의 역할은 언어 환경이 파편화된 인도의 거주민들에게 170여가지 정부 정책 정보를 알리고 정부 지원 사업에 접근할 수 있게 하는 것이죠. 온라인 IT 매체 테크크런치가 2023년 5월 보도한 내용에 따르면 인도는 세계에서 두 번째로 거대한 무선통신 서비스 시장이지만 상대적으로 규모가 작은 도시와 교외 지역에는 기술 보급이 원활하지 않은 상황입니다. 그리고 인도에서 영어를 유창하게 구사할 수 있는 인구는 전체의 11%에 불과하고 다수인 57% 인구는 힌두어를 더 일상적으로 쓴다고 해요. 국민들의 문해력과 언어 장벽 때문에 정부 정책에 대다수 인구가 접근할 수 없다는 문제가 있는데, 주갈반디는 이 지점을 메우기 위해 등장했죠. 인도에서 시장 지배적인 메신저 앱인 ‘왓츠앱’을 활용하는 주갈반디는 AI4Bharat의 언어 모델과 MS 애저 오픈AI 서비스의 추론 모델을 이용해 현지언어 텍스트와 음성으로 개인 사용자가 묻는 질문에 답할 수 있습니다. MS는 현지인에게 주갈반디 보급을 확대해 인도 정부의 디지털 전환 수요를 공략해 나가려는 것으로 보입니다.
코로나19 능동감시부터 일상돌봄, 재난대피까지…’클로바 케어콜’
공공 정책 소외 계층을 지원하는 방향은 한국에서도 쉽게 찾아볼 수 있죠. 네이버는 2022년 4월 서울시 6개 자치구 중장년층 1인 가구에 ‘클로바 케어콜(CLOVA CareCall)을 제공하기 시작했습니다. 클로바 케어콜은 네이버의 음성 AI인 클로바를 응용해 구현한 전화 돌봄 서비스인데요. 클로바 AI가 1인 가구 어르신들에게 전화를 걸어서 식사, 수면, 건강 등을 주제로 대화를 나누면서 당사자의 안부를 확인하고 생활 환경을 추적 관리하는 서비스입니다. 클로바 케어콜도 2021년 코로나19 사태가 한창일 때 코로나19 능동감시 대상자를 모니터링하는 솔루션으로 탄생했고, 이후 음성 AI가 사람과 전화로 대화를 나누면서 제공할 수 있는 다양한 서비스로 역할을 확대하고 있습니다. 클로바 케어콜은 2023년 1월에는 단순 돌봄 서비스뿐 아니라 한파, 대설, 폭염, 호우 등 기상 이변과 재난 상황이 발생해 발송된 재난 문자 내용을 기반으로 목적성 안부 대화를 수행할 수 있게 진화했지요.
위성지도 데이터와 미생물 지식으로 농경과 식량 유통망 최적화
해외에서는 정책 소외 대상자나 취약계층을 돕는 일 외에도, 식량 생산을 확대해서 경작 사업을 효율화하거나 식량 부족 문제를 해결하려는 시도도 이뤄지고 있습니다. 특히 첨단 디지털 기술을 농업 분야에 접목하는 애그테크(AgriTech) 스타트업 기업의 등장과 성장이 활발하죠. 해외 매체인 테크놀로지매거진(Technology Magazine)은 2023년 9월 20일 10대 애그테크 기업을 뽑아 소개했습니다. 특히 10대 기업 가운데 과거 ‘심비오타(Symbiota)’라는 이름으로 알려진 ‘Indigo AG’는 농경 분야 공급망 전반의 지속가능성을 높이는 기술 분야를 연구하는 미국 보스턴 소재 스타트업으로 소개됐는데요. 이 회사는 생물학 지식과 디지털 기술을 결합한 식물 미생물 제품으로 작물 생산과 추수, 보급에 필요한 최적의 공급망을 분석해 화학 비료, 물 사용량, 탄소 배출량을 감축하면서도 면화, 밀, 옥수수, 대두, 쌀 등의 수확량을 늘릴 수 있도록 돕는 기업으로 묘사되었습니다. Indigo AG는 이를 위해 2018년 12월 위성영상업체 텔루스랩스(TellusLabs)를 인수했어요. 당시 세계 식량 유통망의 지도를 개발하고 글로벌 농경 업자 네트워크 데이터를 텔루스랩스에서 분석하고 개별 경작지에 맞춤형 농업 AI 시스템을 제공할 계획을 세워 추진해 왔다고 합니다.
열대우림 900곳 희귀 생물종 보호하는 AI와 생물음향학의 만남
2023년 9월 30일 ABC뉴스는 미국령 푸에르토 리코에서 열대우림 지역에 서식하는 생물종을 AI 기술로 보호하는 구글 연구자들의 활동을 단독 보도했어요. 환경 비영리 단체인 레인포레스트 커넥션(Rainforest Connection)과 구글 산하 비영리재단 구글닷오알지(Google.org) 연구원들이 AI를 사용해 지구 온난화, 불법 삼림 벌채와 개발 등에 위협받고 있는 생태계 서식종 보호방법을 찾고 있다는 내용이죠. 구체적으로 이 프로젝트에는 오픈소스 AI 플랫폼 아비몬(Arbimon)이라는 기술이 사용됩니다. 이는 900여 장소에서 770만건 이상의 소리를 녹음하고, 이러한 음향 데이터를 통해 생물 다양성을 분석하고 관찰하도록 설계됐죠. 이 보도에 따르면 레인포레스트 커넥션 측은 이 방법으로 푸에르토 리코의 고유종이자 희귀 조류인 ‘요정숲울새(Elfin-woods warbler)’나 ‘마운틴 코키(Mountain Coqui)’ 개구리 등 멸종 위기종의 서식지 지식을 개선했다고 설명했어요. 녹음 장치는 구글닷오알지의 AI 기술을 결합해 24시간 내내 숲의 소리를 포착하고 위성 무선통신망에 연결해 실시간 송출하며, 이 소리는 생물음향학이라는 과학 지식으로 분석됩니다. 이전까지 생물학자는 생물음향학 지식을 발휘할 소리를 수집하기 위해 현장에 거대한 마이크를 들고 가서 녹음하고 이를 분석해야 했는데 녹음 한 번에 들이는 시간은 10~15분에 달했지만 분석할 수 있는 소리 길이는 30초에 불과할 만큼 비효율적이었다고 해요. 푸에르토 리코에서처럼 대규모 분석이 가능해진 것은 AI와 같은 현대적 디지털 기술이 발달한 덕분이라는 얘기죠.
반면 챗GPT와 같은 LLM 기반 AI 챗봇 서비스의 영향력이 빠르게 확대되고 상업적인 기술 시장에서 그 입지가 커지고 있는 상황에서 LLM이 초래한 가짜정보 문제와 일자리 감소 위협 우려는 부정적인 사안으로 관심도를 높이고 있죠. 게다가 LLM 기술로 막대한 데이터를 훈련 및 추론하는 데 사용하는 IT 인프라를 구축하고 운영하는 과정에서 큰 에너지를 소비하고 이는 전력 생산과 소비에 맞물려 있는 탄소배출량 증대 및 기후 위기 심화를 야기한다는 비판마저 나오고 있습니다. AI가 인류를 한단계 높은 수준의 생활과 사회로 나아가게 하려면 이러한 문제들이 선결돼야 할 것 같은데요. 비판을 초래하는 배경에 자리한 근본 원인은 사실 첨단 AI의 발전을 가능케 한 요소 자체이기 때문에 쉽지 않은 문제입니다.
“AI 훈련하고 계산하는 데 쓰이는 막대한 에너지, 환경에 부정적”
온라인 전문 사이트 테크타깃은 2023년 9월 11일 ‘거대 언어 모델의 환경 영향 평가’라는 제목의 기사를 게재합니다. 이 기사의 저자는 “오늘날 LLM이 기존 모델보다 훨씬 더 많은 매개변수를 갖고 있다”며 “일부 LLM을 훈련하는 데 필요한 전력은 4~6배 증가했다”고 지적하죠. 그에 따르면 어떤 LLM은 훈련에 수백만 달러 비용이 들고, 이와 함께 필요한 훈련량을 결정할 때 전력 소비량이 중요한 고려 사항이 되었다고 합니다. 저자는 LLM 훈련 시 “광범위한 계산 부하(load)와 더불어 막대한 데이터 저장 및 이동으로 전력 소비량이 늘어나고 열 배출량이 커진다”면서 “열 부하는 냉각에 더 많은 전력이 사용됨을 의미하는데 이 방법은 수온을 높여 지역 생태계에 부정적 영향을 미칠 수 있고 일부 수냉식 냉각 방법은 물을 오염시키기도 한다”고 비판하죠. 한 번 제작한 LLM을 영구적으로 쓸 수 있다면 이러한 나쁜 영향을 상쇄할 수도 있겠지만, 이 저자의 생각에 따르면 모델을 쓸 수 있는 기간 자체도 몇 주에서 몇 달에 불과하고 이후에는 다시 모델 훈련 과정을 반복하면서 또 에너지와 자원을 소모해야 한다는 점에서 나쁜 영향을 상쇄하기는 어려워 보입니다.
LLM을 훈련하고 만드는 과정만이 문제가 아닙니다. 미국 컬럼비아대학교 기후대학원이 운영하는 환경 전문 매체 ‘스테이트 오브 더 플래닛(State of the Planet)’의 정규 필진인 환경운동가 르네 초(Renee Cho)는 2023년 6월 ‘AI의 탄소 배출량 증가’라는 기사를 통해 이렇게 꼬집었습니다. “방대한 데이터를 처리하고 분석하려면 모델 훈련을 위해서도, 일단 훈련된 후에는 새로운 데이터에 대해 예측하고 질의에 응답하기 위해서도 LLM에 수만 개 첨단 고성능 칩이 필요하다. (중략) 특수 전자 회로인 GPU는 많은 계산과 프로세스를 동시에 실행할 수 있어 널리 사용되며 다른 종류의 칩보다 더 많은 전력을 소비한다. (중략) 오늘날 데이터 센터는 연중무휴 24시간 운영되며, 재생 가능한 에너지 자원을 사용하려는 노력이 늘고 있지만 대부분 화석 연료에서 에너지를 얻는다. 전 세계 온실가스 배출량 2.5~3.7%를 데이터센터 소비 에너지가 차지하고, 이는 항공 산업 온실가스 배출량을 능가하는 수치다.” 물론 그는 AI를 활용해 기후 변화로 인해 혼란이 발생할 장소를 예측하고 대비하는 모델을 개발할 수 있고, 다양한 제조, 공급망, 발전 등 분야에서 전기 관리와 에너지 소비 효율 개선 기회를 찾는 등 기후 변화에 능동적으로 대처할 수도 있을 것이라고 첨언했지요. 앞으로 초거대 AI 기술을 연구하는 기업과 활용하는 사용자 개인, 기업, 국가 등이 모두 관심을 기울여야 할 영역이 여기에 있다는 점을 시사합니다.
가짜 정보로 인한 사회 혼란과 일자리 감소 위기 도래…실존 위협론도
이미 실존적인 초거대 AI와 LLM 관련 사회 문제도 나타나고 있습니다. 미국에 본사를 둔 스타트업 전문 매체 빌트인(Built In)은 2023년 10월 31일자 기사를 통해 AI의 12가지 위험성을 도출해 제시했죠. 첫째는 현재 LLM과 초거대 AI에 통용되는 요소 기술과 결과물에 투명성과 설명가능성이 부족하기 때문에 AI에 의존하는 결정이 편견이나 올바르지 않은 결과로 나타날 수 있다는 우려가 있다는 점이에요. 둘째는 컨설팅 업체 맥킨지가 2030년까지 미국 경제에서 인간의 근무 시간 30%가 AI 기반으로 자동화하고 투자은행 골드만삭스가 AI 자동화로 정규직 일자리 3억개의 소멸을 예측할 만큼 각 산업별 일자리 감소 가능성이 높게 예측된다는 것이고요. 셋째는 생성 AI, 사회관계망서비스(SNS) 같은 플랫폼에 적용된 AI를 악용해 가짜 뉴스, 잘못된 정보를 유포하거나 전쟁 선전 수단으로 삼는 세력이 나타나는 등 문제로 사회적 조작이 횡행하고 시민들의 사회적 신뢰가 흔들리게 됐다는 점입니다. 이 밖에도 AI 기술로 광범위한 시민 감시를 통해 프라이버시를 침해하고, 스스로 AI 도구를 사용하는 당사자에게 주어지는 개인정보보호 수단이 취약하고, AI가 작동할 때 내재한 편견이 사용자에게 작용할 수 있다는 점도 심각한 문제로 꼽힙니다. AI의 작동 결과가 사회경제적 차별을 야기하고, AI가 공공선이나 공중 도덕과 같은 윤리적인 가치를 취약하게 만들 수 있고, 전쟁과 같은 환경에 AI로 자동화된 무기가 인간 병사를 공격해 목숨을 빼앗을 수 있는 등 윤리적 문제가 부상했습니다.
미국 일간지 뉴욕타임스는 2023년 5월 1일 보도를 통해 AI로 야기될 문제를 단기, 중기, 장기적 문제로 구분해 전망하고 있습니다. 앞서 언급한 것처럼 사람들이 진실과 허구를 분리하는 데 어려움을 겪고 의학적 조언이나 정서적 조력을 받을 때 사용하는 정보를 얻는 데 허위 정보를 제공할 수 있는 AI에 의존하게 될 것을 단기적 위험으로 짚었죠. 사람처럼 자연스럽게 말하고 대화하는 고성능 AI 챗봇은 그 자연스러움과 거침없음 때문에 설득력을 보여 주지만 그 자체는 내용의 진실성을 보장하지 않으니까요. 그리고 오픈AI의 GPT-4와 같은 챗봇은 변호사, 회계사, 의사 등의 인간 업무를 보완하는 역할을 주로 내세우고 있지만 이들이 법률 보조원, 개인 비서, 번역가를 대체할 수 있는 것처럼 어떤 사람들을 실직의 위기로 몰기도 한다는 것이 중기적 위험입니다. 뉴욕타임스 보도에 따르면 오픈AI 연구원의 논문에서 미국 인력 80%의 작업 가운데 최소 10%가 LLM의 영향을 받고 인력 19%의 작업은 최소 50%가 영향을 받을 수 있다는 추정을 제시했습니다. 장기적으로는 ‘미래생명연구소’와 같은 비영리 단체에서 일론 머스크, 요슈아 벤지오 같은 유명인을 비롯해 많은 석학과 기술 업계 명사들이 지지한 것처럼 AI가 극단적으로 빠르게 발달해 강력해지고, 스스로 인류를 위험에 빠뜨릴 수 있는 코드를 만들어내 실행하지만 이를 인류가 통제할 수 없어 위협받는 시나리오도 대두되었죠.
—
솔트룩스 네이버블로그 ‘인공지능 인사이트’ 필진으로서 작성한 스무 번째 정기 원고. 231205 솔트룩스 네이버블로그 포스팅으로 게재됨. 240114 개인 블로그에 원문 비공개로 올림. 241024 공개로 전환.