Travel & People

People

[IT] Some Things about ChatGPT

Onepark 2023. 3. 8. 16:10

OpenAI.com의 초거대 언어모델(large language model: LLM)인 생성형 인공지능(generative pretrained transformer: GPT) 챗GPT가 등장한지 불과 몇 달 만에 전세계적으로 폭발적인 관심을 불러일으켰다. 그와 동시에 보이스피싱, 딥페이크 같은 그의 오ㆍ남용에 대한 우려도 커지고 있다.

 

마치 미국의 시인 앨런 긴즈버그(Allen Ginsberg, 1926-1997)가 쓴 다음 시를 읽는 것 같다. 反산업문명, 반전, 성적소수자 같은 이슈를 둘러싸고 히피 세대를 대변하였던, 늘 논쟁거리를 몰고다녔던 그 사람이다.

앞으로 이같은 대화형 인공지능을 적용한 서비스가 늘어남에 따라 사람들은 좋든싫든 간에 삶의 일부로 받아들이거나 아니면 의도적으로 이를 거부하는 입장에 처하게 될 것으로 보인다. 

 

 

Some Things  by Allen Ginsberg

어떤 것들  - 앨런 긴즈버그

 

Some things,

once you've loved them,

become yours forever.

 

And if you try to let them go...

they only circle back and return to you,

they become a part of who you are...

...or they destroy you.

한때 네가 사랑했던 어떤 것들은

영원히 너의 것이 된다.

네가 그것들을 떠나보낸다 해도

그것들은 원을 그리며

너에게 돌아온다.

그것들은 너 자신의 일부가 되거나…

…너를 부숴버리기도 한다. [1]

 

필자 역시 챗GPT의 답변 내용에 열광한 바 있다. 복잡한 내용의 질문도 간단 명료하게 균형잡힌 관점에서 답변을 해준다. 많은 사람들이 보고서, 연설문의 작성, 심지어는 자기소개서의 작성까지 챗GPT에 맡기고 있다. 또한 영어작문의 첨삭, 장문의 요약 그밖에 머리를 써서 조사하고 정리해야 하는 일을 시키는 것도 보았다.

 

그 사이 내 나름대로 요령이 생겼다. 컴퓨터란 input을 잘해야 output도 좋기 마련(GiGo)이지만 챗GPT는 3000자 이내에서 질문의 요지를 파악한 다음 그동안 머신러닝으로 축적해놓은 데이터에서 최적의 어휘를 조합하는 방식이므로 자기가 의도하는 질문을 정확히 전달해야만 만족스러운 답변을 얻을 수 있는 것이다. 그러므로 Papago나 Google 번역기를 쓰더라도 그대로 따붙이지(copy & paste)하지 말고 질문의 취지와 의도를 살릴 수 있는 뉘앙스가 담긴 영어로 고쳐 말하는 게 좋다. 대부분의 경우 챗GPT가 질문의 워딩을 반복하여 답변을 시작하는 걸 보아도 알 수 있다.[2]

질문 자체를 정확한 영어로 고쳐달라(Correct)고 할 수도 있으며 1차 답변이 신통치 않을 때에는 다시하라(Regenerate)고 요구할 수 있다. 만족스러운 답변에 대하여 "좋아요"라고 피드백을 해주면 챗GPT의 성능을 향상시키는 데 큰 도움이 된다고 한다. 

 

그렇지 않으면 요즘 MZ세대에게 인터넷 밈이 되어 버린 "세종대왕의 맥북 프로 던짐 사건"처럼 되고 말 것이다. 챗GPT의 개발에 얼마나 많은 노력과 자금이 들었는지 생각한다면 무료 이용자로서 도리가 아니라고 본다. 상기 긴즈버그의 詩구절처럼 나를 파괴시키는 어떤 것이 되어 버리면 피차 불행하지 않겠는가!

나로서도 언제 어디서 챗GPT에 대한 소감이나 경험담을 말해야 될지 모르므로 그 동안 이를 소개했던 웹사이트나 블로그 기사를 한 눈에 알아볼 수 있게끔 정리해 두기로 했다. 이와 더불어 내가 보관하고 있는 엄청난 분량의 각종 자료를 조만간 - 말 그대로 sooner or later - 이러한 초거대 언어모델인 인공지능에 처리를 맡긴다면 뭔가 부가가치 높은 참신한 자료로 재탄생하지 않을까[3] 상상해보는 기대를 갖게 되었다.

 

Overall

* (조선일보 230202) 챗GPT, 미 MBAㆍ로스쿨ㆍ의사면허 모두 패스 - 화이트칼라 일자리 대체 가능성

* (KINS 230224) 챗GPT 등장, 질문과 창의력이 중요해지는 시대

* (조선일보 230228)  한국어에 능통한 초거대 AI :  네이버는 하이퍼클로바X와 서치GPT, 카카오는 코GPT와 칼로 연내 서비스 계획

* (조선일보 230228)  챗GPT에게 묻는 인류의 미래 : KAIST 뇌과학자 김대식 교수의 챗GPT를 이용한 저술 경험담

* (ZDNet Kor 230307)  국내 스타트업 업계 "챗GTP 열풍에 올라타자"

 

* (조선일보 230310)  앱 안에 챕GPT 이용 서비스, 생태계 조성 경쟁 스타트

* (조선일보 230318)  챗GPT도 놀란 韓공학자 - 아이언맨처럼 집에서 로봇 만드는 시대 곧 도래

* (독서신문 230319)  국내 첫 챗GPT 작가 탄생 - 독자 반응은? 

* (조선일보 230320)  AI가 바꾸는 업무혁명 - 생성 AI가 업무 송두리째 바꿔놓을 판

* (조선일보 230322)  챗GPT가 전해준 섬뜩한 경고 : 서울대 윤석민 교수의 체험기

 

* (조선일보 230324)  AI 특이점 시대, 서민은 어떻게 보호할건가 : 권대석 하인텔 대표

* (매일경제 230327)  게임업계까지 불어닥친 생성형 AI 열풍

* (한국경제 230330)  질문 실력이 중요한 챗GPT시대 : 고승연 LG경영연구원 연구위원

* (조선일보 230403)  챗GPT 탓에 기업마다 정보보안 골머리

* (조선일보 230413)  챗GPT 오류 제보 시 포상금 지급 : OpenAI의 Bug Bounty program

 

* (조선일보 230414)  공공서비스 통합 AI디지털 플랫폼 정부 청사진

* (조선일보 230504)  AI의 공습: 법률업무도 44% 대체 가능[4][5]

* (ZDNet Kor 230524)  MS, "당신만의 챗GTP, Copilot를 만드세요"

* (법률신문 230622)  EU, 세계 첫 ‘AI 규제법’ 도입 초읽기, 한국형 AI법’은 국회 심사 중

* (조선일보 230627)  AI가 만들어주는 이력서 사진

 

* (조선일보 230627)  대법원 양형위원회 AI의 형량 결정에 관한 심포지엄 개최

* (AI타임스 230627)  메타, 이용자의 상업적 App 서비스를 허용하는 LLaMa 오픈소스 공개

* (조선일보 230630)  국정원, 챗GPT에 개인정보・비공개정보 입력 금지하는 보안수칙 공개 

* (주간동아 230704)  오픈AI  ‘플러그인’으로 인터넷 생태계 재편 시도

* (조선일보 230705)  [김정호의 AI시대의 전략] 神 아닌 알고리즘이 지배하는 세상

 

* (AI타임스 230716)  생성형 AI, 학습용 콘텐츠의 원작자들로부터 저작권 침해 소송 당할 위기

* (매일경제 230719)  메타, PC에 내려받아 개인적ㆍ상업적으로 이용할 수 있는 오픈소스 대형언어모델인 LLaMA2 공개

* (인공지능신문 230724)  충청남도, 공공분야의 업무효율을 높이는 생성형 AI 활용안내서

* (인공지능신문 230801)  토종 업스테이지, 챗GPT 넘어 ‘세계 최고 LLM’ 등극

* (시사위크 230825)  실망스러운 ‘하이퍼클로바X’ 학습향상이 관건

 

* (조선일보 230915)  [박건형의 홀리테크] 인공지능이 해커에 놀아나면 어쩌나 …

* (조선일보 231016)  기업들 ‘생성형 AI 활용’ 수익화 전쟁

* (DeepAive 231113)  커스텀 GPT 만들기 가이드, (조선일보 231116) 개인 맞춤형 GPT

* (IT World 231122)  '생성형 AI의 기반' 대규모 언어 모델이란?

* (조선일보 231127)  챗GPT 1년, 기업 혁명; 주식 추천, 요리 레시피 등 맞춤형 AI 2만 개 육박

 

* (법률신문 231130)  [창간 73주년 특집] AI로 법률산업에 생산성 혁명

* (조선일보 240129)  학생 과제물의 챗GPT로 만든 문장 체크하여 공정 평가 진행

* (조선일보 240214)  식단 짜기 도움 주는 챗GPT

* (조선일보 240224)  대법원, 2024.9월 재판 보조 시스템 도입

* (조선일보 240224)  AI가 다 통·번역해주는 시대… 위기의 어문학과

 

* (조선일보 240308)  '가짜의 진원지'가 된 생성형 AI

* (조선일보 240320)  교사들의 생기부 작성 돕는 챗GTP, 대학 입학사정관은 표절 문장 가려내는 방안 고심 중

 

* 어느 화가가 세상을 보는 방법: 프랑수아즈 질로, 파란 프랑스식 창, 1939.

Personal Q & A

* (230129)  AI 시대 과학, 예술 분야에 있어서 하나님의 영역 

* (230202)  한국법에 관한 온라인 영문 백과사전  KoreanLII의 AI시대 서바이벌 전략

* (230202)  사람의 자비심과 의지적인 노력의 개입 여부

* (230211)  영화 <천국의 기적>과 임사(near death) 체험 사례

* (230217)  AI 시대에 시인의 마음을 가진 법률가의 존재의의

 

* (230301)  미국 사회에서 한국이민자의 역할

* (230305)  운명론(fatalism)에 대한 이해와 평가

* (230313)  기드온의 기습 전법과 AI의 약점

* (230316)  In Search of a Competent Translator

* (230322)  AI 번역기로 한국 시를 번역해본다면?

 

* (230226)  클라라 슈만의 리트와 우리 가곡 '마중'

* (230407)  人工미인의 등장에 따른 우려

* (230421)  챗GPT에게 물어본 프랑스 여행계획

* (230514)  챗GPT의 게으른 독서가에 대한 권면

* (230522)  Bard와 챗GPT에 의한 영화 The Fabelmans의 분석 

 

* (230627)  단순 반복적 웹사이트 내용 수정을 위한 '봇' 제작 요령

* (230722)  YouTube의 관심 동영상 추천 알고리즘에서 벗어나려면

* (230724)  Bard에게 물어본 영화 Mission Impossible 7의 실제와의 차이

* (230818)  Bard에게 알아본 칼 오르프의 Carmina Burana No. 21 'In trutina'의 가사 

* (230906)  Bard에게 KoreanLII에 싱가포르의 Guest 접속이 폭증한 이유와 대책 문의

 

* (230917)  DG Forum에서 "AI GPT를 쓰면 우리의 일상이 얼마나 편리해질까?" 발표

AI GPTm_230917.pptx
2.01MB

 

* (240229)  "본격적인 AI시대에 대비하는 법학도의 자세" (경희법학연구소, Global Business Law Review 시론)

 

References

* (SLATE.com 230112) Wikipedia를 운영하는 위키미디어 재단의 인공지능(AI)에 대한 입장

* (조선일보 230206) 챗GPT의 작동원리를 자세히 설명한 박건형의 디코드 2.0 기사 

* (국회입법조사처 230303) 챗GPT의 등장과 인공지능 분야의 과제

NARS_챗GPT_인공지능과제.pdf
0.29MB

 

* (New York Times 230308) Noam Chomsky, The False Promise of ChatGPT; 독자들의 반응

* (Lexology 230310) ChatGPT in practice - major legal issues

* (경전TV 230315) ChatGPT 혁명의 이해와 준비, 정보산업연합회 2023 디지털 리더십 포럼 3월 조찬강연

* (율촌 Legal Update 230320) 「AI(인공지능) 산업 육성 및 신뢰기반 조성에 관한 법률」제정 동향

* (법제연구원 230601)  법제연구 Summer  챗GPT 돌풍, 그리고 AI

 

* (아웃스탠딩 230626)  한국어 중심의 ChatGTP가 필요한 이유

* (AI타임스 230626)  대형언어모델(LLM)은 오픈소스가 대세

* (법제연구원ㆍ국회도서관 230713)  법률 분야 생성형 AI 활용과 과제

* (Deloitte 230811)  딜로이트 , ‘인공지능 활용서' 발간 (English, Korean) - AI 적용가능분야

* (이경전 교수 페이스북) 영어로 학술논문을 쓸 때 유용한 팁

 

* (법률신문 231018)  Lexis/Nexis, 법률 서비스에 혁신을 가져올 Lexis+AI  출시

* (AI타임스 231024)  동의 없이 이미지 가져다 쓰면 AI '붕괴'

* (조선일보 231115)  생성형 AI 이중면책의 함정

 

Note

1] 앨런 긴즈버그의 시 "어떤 것들"은 류시화가 2020년 수오서재에서 펴낸 《마음챙김의 시》에 수록되어 있다. 편역자는 이 마지막 행을 빼놓고 소개하였는데 필자로서는 "...or they destroy you"라는 구절이 시인의 본래 의도가 아니었을까 하는 생각이다.

 

2] 따라서 챗GPT 같은 생성 AI가 제일 잘하는 것은 5000자 이내의 긴 문장을 간추려 요약하는 것과 이미 풍부한 데이터를 확보해 놓은 증권분석, 일기예보, 스포츠 기사를 작성하는 것이라고 한다. 이용자의 질문에 포함된 데이터가 타인의 저작권에 속한 것이거나 민감한 정보, 영업비밀을 포함하고 있는 경우에는 큰 문제가 될 수 있다. 또한 생성 AI의 본질적 한계로서 사람의 모니터링(pre-training)을 받지 않은 것은 엉뚱한 답(환각, hallucination), 틀린 답을 내놓을 수 있음을 주의해야 한다.

 

3] 이 문제 역시 챗GPT에게 물어 보았다. 내가 갖고 있는 자료는 대부분 한글로 되어 있으므로 챗GPT는 개인적 자료를 처리할 때 무슨 방법론을 쓰는지 알아본 것이다. 나중에 기회가 되면 블로그에 자세히 올리겠거니와 다음과 같이 5단계로 작업을 한다고 말했다. OpenAI는 챗GPT의 API와 작업과정을 공개한다고 했는데 역시 그러한 것 같았다.

• 1단계 (Extract and organize your data)  주제별로 분류하는 것이 중요

• 2단계 (Clean and Format your data) GPT 심층학습이 용이하도록 불필요한 정보는 없애고 데이터를 표준화하여 CSV 또는 JSON 형태로 전환

• 3단계 (Train a language model) GPT가 데이터를 학습하고 일정한 패턴과 상호관계를 파악하게끔  Hugging Face나 Google Colab같은 툴을 가지고 훈련. 우리나라에서는 네이버, 카카오가 이런 툴을 만들어놓았을 것으로 생각됨.

• 4단계 (Generate new content) 데이터의 패턴이나 상호관계에 기초하여 새로운 콘텐트를 만들어보도록 유도하고 당초 의도한 모델에 가까워지는지 점검

• 5단계 (Refine and edit your content) GPT가 기계적으로 만들어낸 콘텐트가 부정확하거나 당초 의도에 맞지 않을 수 있으므로 사람(human editor)이 계속 고치고 바로잡도록 함

 

4] 미국의 30년 경력 변호사가 법원에 제출한 서류(legal brief)에 챗GPT가 찾아낸 판례를 포함시켰다가 법원 청문회에 회부될 처지에 놓였다. 2023년 5월 케빈 카스텔 뉴욕 맨해튼 연방법원 판사는 가짜 판례가 담긴 의견서를 제출한 스티븐 슈워츠 변호사와 피터 로두카 변호사에 대한 제재를 논의하기 위해 청문회를 열기로 했다. 슈워츠 변호사는 2019년 엘살바도르에서 뉴욕행 아비앙카 항공 여객기를 탔던 승객 로베르토 마타의 사건을 맡았다. 마타는 비행기 탑승 중 기내식 운반용 철제 카트에 부딪혀 무릎을 다쳤다며 항공사를 상대로 소송을 냈다. 항공사 측은 항공사건 공소시효(2년)가 지났다며 맨해튼 연방법원에 사건을 기각해달라고 요청했다. 그러자 슈워츠 변호사는 6건 이상의 유사한 판례를 담은 10페이지 분량의 반대 의견서를 법원에 제출했다. 그런데 그 중 최소 6건이 거짓인 것으로 밝혀졌다. 항공사 측 변호사는 지난 3월 법원에 "원고 측 의견서에 포함된 중국 남방항공 사건 판례, 2008년 제11연방고등법원의 대한항공 관련 판결문을 도저히 찾을 수 없다"며 "원고 측 문건은 챗GPT에 의존해 작성한 것으로 보인다"는 의혹을 제기했다. 이에 대해 슈워츠 변호사는 챗GPT의 도움을 받은 사실을 인정하고, 법원과 항공사를 속일 의도는 아니었으며, "지금까지 AI 챗봇을 한 번도 써본 적이 없어서 그것이 가짜일 수 있다는 점을 인지하지 못했다"고 법원에 선처를 호소한 것으로 알려졌다. NYT는 "AI가 상당수 전문직의 존립을 위태롭게 한다는 우려가 커지고 있지만 아직 AI가 이들 직종을 대체하기까지 시간이 더 필요함을 보여주는 사건"이라고 평했다. 출처: 법률신문 2023.05.29.

PS. 맨해튼 연방지법은 슈워츠 변호사와 로두카 변호사에 대해 미국 사법시스템의 기본수칙(basic precept)를 어겼다며 각각 벌금 5천 달러를 선고하고 가짜 판결을 한 재판관으로 기재되었던 실명의 판사들에게 사과문을 제출하도록 명령했다. 출처: New York Times, 2023.06.22.

 

5] 현재 국내에서 서비스되는 생성형 AI의 법 실력은 어느 정도일까? 법률신문 기자가 직접 체험해보고 흥미로운 결과를 얻을 수 있었다.

현재 국내에서 법률 분야 생성형 AI 서비스를 제공하는 곳은 다음과 같다. 생성형 AI의 선두 주자, 오픈AI에서 제공하는 '챗GPT', 구글에서 제공하는 '바드(Bard)', 국내 리걸테크 업계의 대표적 기업인 인텔리콘(대표 임영익)이 출시한 '로(Law) GPT', 그리고 이혼 분야에 관해서는 최근 출시된 로앤굿(대표 민명기)의 '로앤봇' 등이다. 챗GPT는 높은 접근성과 광범위한 답변이 장점이고, 바드는 높은 범용성과 정확도를 보였다. 로GPT는 관련 조문과 판례를 제공하는 것이 장점이라 법조인의 업무 툴(tool)로 적합해 보였다. 로앤봇은 전문적인 개념을 제공하는 점이 인상적이었다. 출처: 법률신문 2023.06.22.