폴인 게시글 https://www.folin.co/article/5238 발췌본 입니다.
활용안이 무궁무진한 생성 AI. 일단 프롬프트를 잘 쓰는 법을 터득하라고 조언을 하네요.
집요하게, 의도를 분명히 해서 계속 써보기. 오늘도 프롬프트 잘쓰는 법 연구를 많이 해야겠습니다 😂 😀
3줄 요약
- 생성AI가 광고와 커머스업계에서도 적극 활용되고 있습니다. 광고에 쓰이는 이미지나 음악, 카피라이팅을 AI에 맡기는 거죠.
- 이미지 생성AI ‘칼로’를 개발하는 카카오브레인 김세훈 총괄디렉터와 이동훈 연구팀장은 ”지금은 조수 수준이지만 결국엔 나와 문제를 함께 해결해 나가는 동료가 돼줄 것”이라는데요.
- 두 연구원은 “잘 안 돼도 집요하게 계속 써보라”고 말합니다. ‘AI에게 이렇게 말을 걸어야 되는구나’ 감이 올 때까지요.
이 아티클의 썸네일은 ‘칼로’로 만들었습니다. ‘에디터와 두 연구원의 인터뷰 현장’이라는 입력어를 넣었어요. 연구원 두 분이 안경을 쓰고 있다는 특징도요.
세렝게티 초원 한복판에 앉아 노트북을 하는 여성. 누구일까요? 저라면 좋겠지만, 아닙니다. 수억 개의 이미지와 텍스트를 학습한 생성AI가 만들어낸, 세상에 없던 이미지죠. ‘세렝게티 초원에서 노트북으로 일하는 검은 머리 여성과 야생동물을 그려줘’라는 명령어를 주니 그럴듯한 이미지를 만들어 낸 거예요.
AI는 많이 들어봤는데, 생성AI는 또 뭘까요? 명령어를 이해하고, 세렝게티와 노트북 하는 여자라는 맥락을 엮어 스스로 콘텐츠를 생성해내는 AI를 뜻해요. 오픈AI의 챗GPT, 미드저니, 구글의 바드(Bard) 등도 모두 생성AI를 기반으로 한 서비스들이죠.
구글과 마이크로소프트 같은 기업들이 뛰어드는 걸 보면 생성AI가 테크 업계의 가장 큰 화두인 건 확실한데요. 그래서 이 기술이 우리 직장인들에게 어떤 영향을 미칠지, 어떻게 쓸 수 있는 건지 도통 감이 잘 오지 않아요.
누구에게 물어볼 수 있을까 수소문한 끝에 카카오브레인의 이미지 생성AI 칼로Karlo팀 연구원을 만났어요. 최근 한국어를 이해하고 이미지를 생성해내는 ‘칼로 2.0’을 발표했거든요. 생성AI가 어떻게 활용되고 있는지, 어디까지 왔는지, 앞으로 어디까지 갈 수 있을지 칼로팀 김세훈 총괄디렉터와 이동훈 연구팀장에게 물었습니다.
24시간 소통가능한 ‘나만의 동료’가 생긴다
경기도 성남시 판교에 있는 카카오브레인 사옥에서 만난 이동훈 연구팀장과 김세훈 총괄디렉터 ⓒ폴인, 최지훈
Q. 생성AI, 왜 써야 되나요?
이동훈 연구팀장(이하 이동훈): ‘아 이거 누가 좀 대신 해줬으면 좋겠다’ 싶었던 일을 해주니까요. 안 쓸 이유가 없죠(웃음). 앞으로 모두가 쓰게 될 거예요. 카카오브레인 사옥이 어디 있는지 궁금한 사람, 30장 짜리 PPT 자료를 10분 내로 만들어야 하는 사람 모두요. 세상의 정보를 얻는 방식, 일하는 방식이 바뀌고 있어요. 나만 이걸 왜, 어떻게 써야 하는지 모르면 나중에 쫓아가기 어렵지 않을까요.
Q. 어디에 어떻게 쓰이고 있길래요?
김세훈 총괄디렉터(이하 김세훈): 비즈니스 현장에서는 대기업들도 빠르게 활용하고 있어요. 최근 코카콜라가 생성AI로 만든 이미지로 광고 영상 만든 거 보셨나요? 코카콜라 병과 로고 이미지를 명화에 뒤섞어 세상에 없던 이미지를 만들었어요. 생성 이미지에 모션까지 더해서 영상화 했고요.
삼성생명도 최근 AI가 생성한 이미지와 음악으로만 광고를 만들었죠. 광고 카피에 들어갈 문구 초안이나 제품 상세 페이지를 생성AI로 만들기도 해요. 기술 단계에서의 이야기를 넘어 이미 다양한 비즈니스 업계에서 생성AI로 아이디어와 프로젝트의 수준을 끌어올리고 있어요.
이동훈: 2021년 오픈AI의 달리DALL-E가 만든 ‘아보카도 의자’ 기억하세요? 아무도 상상해본 적 없는 걸 만들어 냈잖아요. 아마 사람에게 시켰다면 콘셉트 잡는 데만 한참이 걸렸을 거예요. 그걸 AI는 3초 만에 해냈죠. 코카콜라 광고 이미지도 사람이 처음부터 그리려고 했다면 시간도 오래 걸리고 ‘획기적’이지 않았을 수도 있어요. 창작 초기 단계를 생성AI에게 맡기는 이유고요.
오픈AI의 달리가 생성한 '아보카도 안락의자'
Q. 제가 지금 당장 쓴다면 어떻게 쓸 수 있을까요?
김세훈: 인터뷰 원고를 AI에게 주고 요약을 시키거나, 원하는 형태의 글 레퍼런스를 주고 1차 편집을 시킬 수도 있어요. 발표를 해야 한다면 필요한 자료들을 모아 정리해 달라고 할 수도 있고 요. PPT도 아이데이션만 해서 명령어를 입력하면 초안을 만들어줘요.
저는 늘 챗GPT를 켜놓고 일해요. 개발자들은 코드를 AI가 대신 짜주니까 5시간 걸리던 일을 1시간 내에 끝내버릴 수 있게 됐어요. 일일이 검색해 아카이브에서 코드를 한 줄씩 가져오는 게 아니라, AI가 제일 좋은 코드로 정리해 띄워주니까요. 데이터를 엑셀에 하나하나 입력하던 걸, 생성AI가 짜준 함수식을 적용해 순식간에 처리할 수도 있죠.
이동훈: 저도 문서작업 할 때 아이콘이나 그래픽이 필요하면 생성AI한테 시켜요. 논문을 영어로 쓸 때도요. 대충 콩글리쉬로 써서 주면 영어로 깔끔하게 윤문해줘요. 예전에는 번역기를 역방향까지 두 번 돌리고 확인하느라 시간을 많이 잡아먹었는데요. 생성모델이 불필요한 시간 낭비를 줄여주고 있죠.
Q. 업무 시간 줄여주는 좋은 비서네요.
김세훈: 네. 아직은 보조하는 수준인데, 궁극적으로는 ‘동료’를 만드는 게 목표예요. 내 안에 숨은 아이디어를 끄집어 내주고, 같이 디벨롭하고, 내가 핵심적인 일에 집중할 수 있게끔 불필요한 일을 대신 가져가 주는, 365일 24시간 의사소통이 가능한 동료랄까요. 지금은 내 주문을 이해하고 수행해주는 정도라면, 나중에는 문제 해결방법까지 제안해주는 존재가 되는 거죠.
아직은 이미지 모델과 텍스트 모델이 각각 기능하는데요. 텍스트와 이미지, 음성, 비디오를 모두 받아들이고 결과물을 만드는 ‘멀티모달(multi-modal)’ 모델을 개발하는 데 집중하고 있어요. 초거대 멀티모달 모델이 완성되면 몸만 없다 뿐, 나보다 똑똑한 동료를 얻게 될 수 있을 거예요.
앞으로 4~5년 후면 누구나 이런 동료를 옆에 두게 될 거라고 봐요. 기술 개발과 별개로 서비스 자체가 유저 친화적인 형태로 발전하는 것도 병행돼야 할 거고요.
챗GPT에게 여행 일정을 짜달라고 요청해 얻은 답변.
‘말 거는 법’ 알려면 직접 말 걸어봐야
Q. 그래도 아직은 검색이 편합니다.
이동훈: 그러면 아직 조각을 줍고 있는 거예요(웃음). 검색이 자료를 하나하나 조각으로 얻어 직접 이어 붙이는 작업이라면, 생성AI는 어느 정도 만들어진 미완성의 퍼즐을 통째로 받는 거라고 이해할 수 있어요. 이 효용을 맛보면 못 돌아가죠.
예를 들어 피카소가 생애 마지막으로 그린 그림이 궁금해요. 검색 시스템에서는 피카소의 연도별 작품을 찾아 띄우고, 시기상 마지막 작품이 뭔지 직접 확인해야 하죠. 반면 생성AI는 ‘피카소의 생애 마지막 작품이 뭐야?’라고 물으면 돼요. 정보를 통째로 퍼오겠죠. 사람은 거기서 사실이 아닌 것만 솎아내면 돼요.
김세훈: 잘 쓰기 위해서 뿐만 아니라 한계를 알기 위해서라도 이리저리 써보는 게 좋아요. 점점 정보를 얻는 방식이 검색에서 생성AI로 옮겨갈 텐데요. 패러다임이 바뀌고 나서야 기술을 급히 쓰게 되면, 한계를 모른 채 쓰게 될 수 있어요. 부지불식간에 오용할 수 있는 거죠.
최근 미국에서 변호사가 챗GPT가 알려준 판례를 소송 자료로 썼는데 그게 가짜로 드러났어요. 그 변호사는 챗GPT를 그 자료를 찾을 때 처음 써봤다고 하더라고요. 가짜일 거란 생각을 못해서 그대로 가져다 썼다고요. 이런 한계가 있네, 이걸 못하네 하는 기술적 한계를 인지하고 있었다면 그 변호사도 자료 제출을 하기 전에 한번쯤 의심해봤겠죠.
Q. 챗GPT를 써보긴 했는데, 원하는 결과물을 얻지 못했어요. 어떻게 하면 잘 쓸 수 있나요?
김세훈: 많은 시행착오가 필요해요. 다른 문화에서 다른 언어를 쓰며 살아온 사람에게 어떻게 말을 걸면 좋을지 고민하는 과정과 비슷해요. 결국엔 생성AI에게 말을 잘 거는 법을 터득해야 하는 거죠. ‘아 이렇게 말 걸면 되는구나’ 감이 올 때까지 계속 써보는 거예요. ‘생성AI 잘 쓰는 법’을 검색해보는 것도 방법이고요. 앞서서 많이 써보고 나름대로 방법을 찾은 사람들이 올려둔 팁이 많거든요.
직접 써본다면 의도를 명확히 하는 연습을 해보세요. 예를 들어 그냥 ‘섭외 메일을 영어로 써줘’라고 하는 것보다 ‘누구에게, 어떤 의도를 전달하는 섭외 메일을, 정중한 말투로, 영자 1000자 내로 써줘’라고 입력하는 거예요. 그래도 원하는 결과물을 얻지 못했다, 그럼 더 디테일하고 집요하게 요구해보고요. 쓰면 쓸수록 나와 AI가 함께 똑똑해진달까요.
이동훈: 이걸 잘하는 사람들이 *프롬프트 엔지니어예요. 생성AI를 많이 써보고 연구하면서 이 모델이 어떻게 돌아가는지 기술적인 이해도가 높은 직군이죠. 명령어를 어떻게 입력해야 원하는 결과물을 얻을 수 있을지 잘 아니까 그것만 전문적으로 하는 거예요.
그런데 점점 많은 사람들이 ‘이렇게 말 걸면 되는구나’를 이해하게 되면 프롬프트 엔지니어는 사라지겠죠. 많은 사람과 상호 작용하면서 모델이 더 똑똑해지고, 스스로 문제해결을 할 수 있게 되면 저희 같은 연구원도 사라질 거고요. 생성AI의 한계를 발견해서 개선하는 게 저희가 하는 일인데, 필요 없어질 테니까요. 제 일자리를 없앨 무언가를 연구하고 있네요.(웃음)
*프롬프트 엔지니어: AI를 효과적으로 쓰기 위해 AI에게 어떤 질문을 해야 할지 연구하고, 원하는 결과를 도출하는 일을 한다.임소연 에디터와 김세훈 총괄디렉터, 이동훈 연구팀장이 인터뷰하는 모습을 칼로로 생성한 이미지 ⓒ임소연 에디터
‘육수’ 같은 모델 만드는 게 목표
Q. 연구하고 계신 칼로는 왜 만들게 되셨나요?
김세훈: 2년 전 ‘아보카도 의자’를 보고 충격 받았어요. ‘이게 된다고?’ 우리도 자체 모델이 있어야 한다, 우리는 한국어로도 입력 가능한 모델을 만들어야 한다는 생각으로 연구에 매달렸죠.
지금까지는 패스트팔로워였지만, 이제는 자체 모델을 만드는 수준까지 왔어요. 칼로의 특장점은 화풍이 다양하다는 건데요. 예를 들어 미드저니는 결과물에서 특정 화풍이 보이는데, 칼로는 화풍이 다채로워요. 르네 마그리트나 클로드 모네의 화풍으로 그려달라고 하면 구현해내요. ‘부자 호랑이’와 ‘가난한 호랑이’처럼 추상적인 텍스트를 줘도 이해하고 생성하고요.
Q. 칼로의 목표는 뭔가요?
김세훈: 앞으로는 고품질 데이터로, 고품질 이미지를 생성해내는 게 목표예요. 결국 어느 나라 기업이냐 보다 얼마나 빠르게 좋은 이미지를 생성하느냐 경쟁력이니까요. 목표는 이왕이면 세계 1등이죠.
이동훈: 범용성을 끌어올리는 것도 중요한 목표예요. 다양한 부가가치를 창출하는 데 바탕이 되는 좋은 ‘백본Backbone 모델’, 즉 육수를 만드는 거죠. 음식 베이스가 되는 육수가 좋으면 다양한 음식을 만들 수 있잖아요. 저희가 만든 칼로가 범용모델로서 다양한 제품의 베이스가 된다면 10억 인구, 더 많은 인류에 영향을 줄 수 있지 않을까 생각해요.
"AI가 사만다 수준으로 발전하는 날, 저희는 은퇴를 하겠죠.(웃음)" ⓒ폴인, 최지훈
Q. 생성AI의 미래는 어떻게 전망하시나요?
이동훈: 영화 ‘그녀Her’의 사만다 아시나요. 그게 저희 같은 연구자들의 최종 목표예요. AGI(artificial general intelligence)라고 하는데요. 인간의 지도 없이 스스로 학습하고, 발전하는 최종 단계의 AI예요. 스스로 생각하고, 창작도 가능한 지능요.
김세훈: 지금의 알고리즘으로는 불가능해서, 인터넷이 등장한 것 만큼의 큰 스텝이 있어야 도달 가능할 거예요. 아주 장기적인 목표죠. 어마어마한 데이터량을 학습하는 걸 넘어서 특이점을 넘어야 할 거고요. AI 영역도 세분화되고 전문화되면서, 머리를 맡대면 언젠가 가능해지는 날이 오겠죠. 그날이 곧 저희의 은퇴날이 되겠지만요.(모두 웃음)
폴인 게시글 https://www.folin.co/article/5238 발췌본 입니다.
활용안이 무궁무진한 생성 AI. 일단 프롬프트를 잘 쓰는 법을 터득하라고 조언을 하네요.
집요하게, 의도를 분명히 해서 계속 써보기. 오늘도 프롬프트 잘쓰는 법 연구를 많이 해야겠습니다 😂 😀
3줄 요약
이 아티클의 썸네일은 ‘칼로’로 만들었습니다. ‘에디터와 두 연구원의 인터뷰 현장’이라는 입력어를 넣었어요. 연구원 두 분이 안경을 쓰고 있다는 특징도요.
세렝게티 초원 한복판에 앉아 노트북을 하는 여성. 누구일까요? 저라면 좋겠지만, 아닙니다. 수억 개의 이미지와 텍스트를 학습한 생성AI가 만들어낸, 세상에 없던 이미지죠. ‘세렝게티 초원에서 노트북으로 일하는 검은 머리 여성과 야생동물을 그려줘’라는 명령어를 주니 그럴듯한 이미지를 만들어 낸 거예요.
AI는 많이 들어봤는데, 생성AI는 또 뭘까요? 명령어를 이해하고, 세렝게티와 노트북 하는 여자라는 맥락을 엮어 스스로 콘텐츠를 생성해내는 AI를 뜻해요. 오픈AI의 챗GPT, 미드저니, 구글의 바드(Bard) 등도 모두 생성AI를 기반으로 한 서비스들이죠.
구글과 마이크로소프트 같은 기업들이 뛰어드는 걸 보면 생성AI가 테크 업계의 가장 큰 화두인 건 확실한데요. 그래서 이 기술이 우리 직장인들에게 어떤 영향을 미칠지, 어떻게 쓸 수 있는 건지 도통 감이 잘 오지 않아요.
누구에게 물어볼 수 있을까 수소문한 끝에 카카오브레인의 이미지 생성AI 칼로Karlo팀 연구원을 만났어요. 최근 한국어를 이해하고 이미지를 생성해내는 ‘칼로 2.0’을 발표했거든요. 생성AI가 어떻게 활용되고 있는지, 어디까지 왔는지, 앞으로 어디까지 갈 수 있을지 칼로팀 김세훈 총괄디렉터와 이동훈 연구팀장에게 물었습니다.
24시간 소통가능한 ‘나만의 동료’가 생긴다
경기도 성남시 판교에 있는 카카오브레인 사옥에서 만난 이동훈 연구팀장과 김세훈 총괄디렉터 ⓒ폴인, 최지훈
Q. 생성AI, 왜 써야 되나요?
이동훈 연구팀장(이하 이동훈): ‘아 이거 누가 좀 대신 해줬으면 좋겠다’ 싶었던 일을 해주니까요. 안 쓸 이유가 없죠(웃음). 앞으로 모두가 쓰게 될 거예요. 카카오브레인 사옥이 어디 있는지 궁금한 사람, 30장 짜리 PPT 자료를 10분 내로 만들어야 하는 사람 모두요. 세상의 정보를 얻는 방식, 일하는 방식이 바뀌고 있어요. 나만 이걸 왜, 어떻게 써야 하는지 모르면 나중에 쫓아가기 어렵지 않을까요.
Q. 어디에 어떻게 쓰이고 있길래요?
김세훈 총괄디렉터(이하 김세훈): 비즈니스 현장에서는 대기업들도 빠르게 활용하고 있어요. 최근 코카콜라가 생성AI로 만든 이미지로 광고 영상 만든 거 보셨나요? 코카콜라 병과 로고 이미지를 명화에 뒤섞어 세상에 없던 이미지를 만들었어요. 생성 이미지에 모션까지 더해서 영상화 했고요.
삼성생명도 최근 AI가 생성한 이미지와 음악으로만 광고를 만들었죠. 광고 카피에 들어갈 문구 초안이나 제품 상세 페이지를 생성AI로 만들기도 해요. 기술 단계에서의 이야기를 넘어 이미 다양한 비즈니스 업계에서 생성AI로 아이디어와 프로젝트의 수준을 끌어올리고 있어요.
이동훈: 2021년 오픈AI의 달리DALL-E가 만든 ‘아보카도 의자’ 기억하세요? 아무도 상상해본 적 없는 걸 만들어 냈잖아요. 아마 사람에게 시켰다면 콘셉트 잡는 데만 한참이 걸렸을 거예요. 그걸 AI는 3초 만에 해냈죠. 코카콜라 광고 이미지도 사람이 처음부터 그리려고 했다면 시간도 오래 걸리고 ‘획기적’이지 않았을 수도 있어요. 창작 초기 단계를 생성AI에게 맡기는 이유고요.
오픈AI의 달리가 생성한 '아보카도 안락의자'
Q. 제가 지금 당장 쓴다면 어떻게 쓸 수 있을까요?
김세훈: 인터뷰 원고를 AI에게 주고 요약을 시키거나, 원하는 형태의 글 레퍼런스를 주고 1차 편집을 시킬 수도 있어요. 발표를 해야 한다면 필요한 자료들을 모아 정리해 달라고 할 수도 있고 요. PPT도 아이데이션만 해서 명령어를 입력하면 초안을 만들어줘요.
저는 늘 챗GPT를 켜놓고 일해요. 개발자들은 코드를 AI가 대신 짜주니까 5시간 걸리던 일을 1시간 내에 끝내버릴 수 있게 됐어요. 일일이 검색해 아카이브에서 코드를 한 줄씩 가져오는 게 아니라, AI가 제일 좋은 코드로 정리해 띄워주니까요. 데이터를 엑셀에 하나하나 입력하던 걸, 생성AI가 짜준 함수식을 적용해 순식간에 처리할 수도 있죠.
이동훈: 저도 문서작업 할 때 아이콘이나 그래픽이 필요하면 생성AI한테 시켜요. 논문을 영어로 쓸 때도요. 대충 콩글리쉬로 써서 주면 영어로 깔끔하게 윤문해줘요. 예전에는 번역기를 역방향까지 두 번 돌리고 확인하느라 시간을 많이 잡아먹었는데요. 생성모델이 불필요한 시간 낭비를 줄여주고 있죠.
Q. 업무 시간 줄여주는 좋은 비서네요.
김세훈: 네. 아직은 보조하는 수준인데, 궁극적으로는 ‘동료’를 만드는 게 목표예요. 내 안에 숨은 아이디어를 끄집어 내주고, 같이 디벨롭하고, 내가 핵심적인 일에 집중할 수 있게끔 불필요한 일을 대신 가져가 주는, 365일 24시간 의사소통이 가능한 동료랄까요. 지금은 내 주문을 이해하고 수행해주는 정도라면, 나중에는 문제 해결방법까지 제안해주는 존재가 되는 거죠.
아직은 이미지 모델과 텍스트 모델이 각각 기능하는데요. 텍스트와 이미지, 음성, 비디오를 모두 받아들이고 결과물을 만드는 ‘멀티모달(multi-modal)’ 모델을 개발하는 데 집중하고 있어요. 초거대 멀티모달 모델이 완성되면 몸만 없다 뿐, 나보다 똑똑한 동료를 얻게 될 수 있을 거예요.
앞으로 4~5년 후면 누구나 이런 동료를 옆에 두게 될 거라고 봐요. 기술 개발과 별개로 서비스 자체가 유저 친화적인 형태로 발전하는 것도 병행돼야 할 거고요.
챗GPT에게 여행 일정을 짜달라고 요청해 얻은 답변.
‘말 거는 법’ 알려면 직접 말 걸어봐야
Q. 그래도 아직은 검색이 편합니다.
이동훈: 그러면 아직 조각을 줍고 있는 거예요(웃음). 검색이 자료를 하나하나 조각으로 얻어 직접 이어 붙이는 작업이라면, 생성AI는 어느 정도 만들어진 미완성의 퍼즐을 통째로 받는 거라고 이해할 수 있어요. 이 효용을 맛보면 못 돌아가죠.
예를 들어 피카소가 생애 마지막으로 그린 그림이 궁금해요. 검색 시스템에서는 피카소의 연도별 작품을 찾아 띄우고, 시기상 마지막 작품이 뭔지 직접 확인해야 하죠. 반면 생성AI는 ‘피카소의 생애 마지막 작품이 뭐야?’라고 물으면 돼요. 정보를 통째로 퍼오겠죠. 사람은 거기서 사실이 아닌 것만 솎아내면 돼요.
김세훈: 잘 쓰기 위해서 뿐만 아니라 한계를 알기 위해서라도 이리저리 써보는 게 좋아요. 점점 정보를 얻는 방식이 검색에서 생성AI로 옮겨갈 텐데요. 패러다임이 바뀌고 나서야 기술을 급히 쓰게 되면, 한계를 모른 채 쓰게 될 수 있어요. 부지불식간에 오용할 수 있는 거죠.
최근 미국에서 변호사가 챗GPT가 알려준 판례를 소송 자료로 썼는데 그게 가짜로 드러났어요. 그 변호사는 챗GPT를 그 자료를 찾을 때 처음 써봤다고 하더라고요. 가짜일 거란 생각을 못해서 그대로 가져다 썼다고요. 이런 한계가 있네, 이걸 못하네 하는 기술적 한계를 인지하고 있었다면 그 변호사도 자료 제출을 하기 전에 한번쯤 의심해봤겠죠.
Q. 챗GPT를 써보긴 했는데, 원하는 결과물을 얻지 못했어요. 어떻게 하면 잘 쓸 수 있나요?
김세훈: 많은 시행착오가 필요해요. 다른 문화에서 다른 언어를 쓰며 살아온 사람에게 어떻게 말을 걸면 좋을지 고민하는 과정과 비슷해요. 결국엔 생성AI에게 말을 잘 거는 법을 터득해야 하는 거죠. ‘아 이렇게 말 걸면 되는구나’ 감이 올 때까지 계속 써보는 거예요. ‘생성AI 잘 쓰는 법’을 검색해보는 것도 방법이고요. 앞서서 많이 써보고 나름대로 방법을 찾은 사람들이 올려둔 팁이 많거든요.
직접 써본다면 의도를 명확히 하는 연습을 해보세요. 예를 들어 그냥 ‘섭외 메일을 영어로 써줘’라고 하는 것보다 ‘누구에게, 어떤 의도를 전달하는 섭외 메일을, 정중한 말투로, 영자 1000자 내로 써줘’라고 입력하는 거예요. 그래도 원하는 결과물을 얻지 못했다, 그럼 더 디테일하고 집요하게 요구해보고요. 쓰면 쓸수록 나와 AI가 함께 똑똑해진달까요.
이동훈: 이걸 잘하는 사람들이 *프롬프트 엔지니어예요. 생성AI를 많이 써보고 연구하면서 이 모델이 어떻게 돌아가는지 기술적인 이해도가 높은 직군이죠. 명령어를 어떻게 입력해야 원하는 결과물을 얻을 수 있을지 잘 아니까 그것만 전문적으로 하는 거예요.
그런데 점점 많은 사람들이 ‘이렇게 말 걸면 되는구나’를 이해하게 되면 프롬프트 엔지니어는 사라지겠죠. 많은 사람과 상호 작용하면서 모델이 더 똑똑해지고, 스스로 문제해결을 할 수 있게 되면 저희 같은 연구원도 사라질 거고요. 생성AI의 한계를 발견해서 개선하는 게 저희가 하는 일인데, 필요 없어질 테니까요. 제 일자리를 없앨 무언가를 연구하고 있네요.(웃음)
*프롬프트 엔지니어: AI를 효과적으로 쓰기 위해 AI에게 어떤 질문을 해야 할지 연구하고, 원하는 결과를 도출하는 일을 한다.임소연 에디터와 김세훈 총괄디렉터, 이동훈 연구팀장이 인터뷰하는 모습을 칼로로 생성한 이미지 ⓒ임소연 에디터
‘육수’ 같은 모델 만드는 게 목표
Q. 연구하고 계신 칼로는 왜 만들게 되셨나요?
김세훈: 2년 전 ‘아보카도 의자’를 보고 충격 받았어요. ‘이게 된다고?’ 우리도 자체 모델이 있어야 한다, 우리는 한국어로도 입력 가능한 모델을 만들어야 한다는 생각으로 연구에 매달렸죠.
지금까지는 패스트팔로워였지만, 이제는 자체 모델을 만드는 수준까지 왔어요. 칼로의 특장점은 화풍이 다양하다는 건데요. 예를 들어 미드저니는 결과물에서 특정 화풍이 보이는데, 칼로는 화풍이 다채로워요. 르네 마그리트나 클로드 모네의 화풍으로 그려달라고 하면 구현해내요. ‘부자 호랑이’와 ‘가난한 호랑이’처럼 추상적인 텍스트를 줘도 이해하고 생성하고요.
Q. 칼로의 목표는 뭔가요?
김세훈: 앞으로는 고품질 데이터로, 고품질 이미지를 생성해내는 게 목표예요. 결국 어느 나라 기업이냐 보다 얼마나 빠르게 좋은 이미지를 생성하느냐 경쟁력이니까요. 목표는 이왕이면 세계 1등이죠.
이동훈: 범용성을 끌어올리는 것도 중요한 목표예요. 다양한 부가가치를 창출하는 데 바탕이 되는 좋은 ‘백본Backbone 모델’, 즉 육수를 만드는 거죠. 음식 베이스가 되는 육수가 좋으면 다양한 음식을 만들 수 있잖아요. 저희가 만든 칼로가 범용모델로서 다양한 제품의 베이스가 된다면 10억 인구, 더 많은 인류에 영향을 줄 수 있지 않을까 생각해요.
"AI가 사만다 수준으로 발전하는 날, 저희는 은퇴를 하겠죠.(웃음)" ⓒ폴인, 최지훈
Q. 생성AI의 미래는 어떻게 전망하시나요?
이동훈: 영화 ‘그녀Her’의 사만다 아시나요. 그게 저희 같은 연구자들의 최종 목표예요. AGI(artificial general intelligence)라고 하는데요. 인간의 지도 없이 스스로 학습하고, 발전하는 최종 단계의 AI예요. 스스로 생각하고, 창작도 가능한 지능요.
김세훈: 지금의 알고리즘으로는 불가능해서, 인터넷이 등장한 것 만큼의 큰 스텝이 있어야 도달 가능할 거예요. 아주 장기적인 목표죠. 어마어마한 데이터량을 학습하는 걸 넘어서 특이점을 넘어야 할 거고요. AI 영역도 세분화되고 전문화되면서, 머리를 맡대면 언젠가 가능해지는 날이 오겠죠. 그날이 곧 저희의 은퇴날이 되겠지만요.(모두 웃음)