[AI] In Search of a Competent Collaborator

Onepark 2023. 3. 16. 07:30

2011년부터 온라인 영문 법률백과사전 KoreanLII.or.kr을 운영하는 동안 제일 아쉬웠던 것은 영어를 잘하는 동역자를 구할 수 없다는 점이었다. 내 주변에는 미국에서 학위를 받고 갓 귀국한 소장 학자나 TOEIC 점수가 우수한 법전원 학생들이 적지 않았음에도 KoreanLII를 같이 만들자고 하면 다들 손사레를 쳤다. 그 이유는 광고도 붙지 않고 후원자도 없는 웹사이트에 아무런 보상도 없이 자원봉사자로 참여하기란 가성비(價成比) 최악인 데다 작업의 강도 역시 만만치 않았기 때문이었다. 법전원 저학년생도 변호사시험에 매달리는 등 그 시간에 그만한 노력을 기울이는 일이라면 훨씬 값어치 있고 보람있는 게 더 많은 탓이었다.


우리말 법률 콘텐츠를 확보하는 일은 그리 어렵지 않았으나 이것을 영어로 번역하는 것은 영어만 잘해서는 되지 않고 영미법 용어나 법률용례도 잘 알아야 하므로 쉬운 일은 아니었다. 당초 집단지성(collective intelligence)의 힘을 빌어 분업식으로 온라인 백과사전을 만드는 걸 꿈꾸었으나 현실은 녹록치 않았다. 그리하여 혼자서 KoreanLII를 운영하면서 미처 영어로 다 옮기지 못한 항목(Unfinished Article)이 2021년 1월에는 무려 160개에 달하기도 했다.


2023년 3월 10일 마침내 새로운 동역자를 구하는 데 성공하였다.

그것은 사람이 아니라 초거대 언어모델인 인공지능(large language model-based artificial intelligence)이었다.

2022년 말 챗GPT가 등장하면서 이것저것 이용해보면서 많은 사람들이 Naver Papago나 Google Translate를 사용하는 것을 보고 나 역시 번역의 품질을 더 이상 의심치 않게 된 것이다. 새로 선보인 독일의 다국어 번역기 DeepL 역시 우수하다는 평이었다.[1]

그래서 KoreanLII의 번역담당 동역자를 구하기 위한 면접시험을 보듯이 그때까지 상당 부분 미완성인 채로 두었던 KoreanLII의 LealTech 항목의 번역을 시켜보기로 했다.


* 출처: 조선일보, "파파고ㆍ딥엘ㆍ구글 번역기 써보니 " 2023. 3. 16자

Competitive Test & Comments

1) Legalzoom에서는 변호사가 고객을 만나 일일이 질문하면서 정보를 수집하고 문서를 작성하던 과정을 자동화한 것이다. 예를 들어 어떤 사람이 창업을 하려 한다고 치자. 창업에 필요한 법률 서식을 작성하려는 사람이 Legalzoom에 접속하면, 자동화 프로그램이 몇 가지 질문을 던진다. 답을 작성하면 그 답을 토대로 또 다른 질문을 던지면서 프로그램이 서식을 완성한다. 똑같이 창업을 준비하더라도 어떤 사람은 열 개의 질문만 받지만, 다른 사람은 스무 개가 넘는 질문에 답을 해야 할 수도 있다. 서식 작성이 끝나면 제휴 로펌의 변호사에게 1회 30분씩 전화나 이메일로 법률 자문 서비스를 받게 된다. 자신이 하려는 일에 대한 내용을 완전한 서식으로 만든 뒤 그 내용을 토대로 상세한 상담을 받는 것이다.


Google: Legalzoom automates the process of meeting clients, asking questions, collecting information and preparing documents. For example, let's say someone wants to start a business. When someone accesses Legalzoom to fill out legal forms for a start-up, the automated program asks them a few questions. When you write an answer, the program completes the form by asking another question based on the answer. Even when preparing for a start-up in the same way, some people get only 10 questions, while others may have to answer more than 20 questions. After completing the form, you will receive legal advice by phone or e-mail for 30 minutes at a time from a lawyer at an affiliated law firm. After making a complete form of the work you want to do, you receive detailed counseling based on the content.


Papago: Legalzoom automates the process in which lawyers meet customers and ask questions one by one to collect information and write documents. For example, let's say someone is trying to start a business. When a person who wants to fill out a legal form for a start-up accesses Legalzoom, the automation program asks some questions. When you fill out the answer, the program completes the form by asking another question based on the answer. Even if you prepare to start a business in the same way, some people only receive 10 questions, but others may have to answer more than 20 questions. After completing the form, you will receive legal advice services by phone or e-mail from lawyers of affiliated law firms for 30 minutes at a time. After making the content of what you are going to do in a complete format, you receive detailed consultations based on the content.


DeepL: Legalzoom automates the process of a lawyer meeting with a client, asking questions, gathering information, and creating documents. For example, someone wants to start a business. When they go to Legalzoom to fill out the legal forms needed to start a business, the automated program asks them a few questions. You fill out the answers, and the program asks another set of questions based on those answers to complete the form. The same person preparing to start a business might only be asked ten questions, while another might have to answer over twenty. Once you're done filling out the form, you'll receive a 30-minute phone or email consultation with a lawyer from an affiliated law firm. The idea is that you fill out a complete form about what you want to do, and then you get a detailed consultation based on that.


Comment: Google과 DeepL은 압축해서 번역하는 느낌. Papago는 한국 사람이 알기 쉽게 풀어서 번역. 문맥상 글쓴이의 의도까지 파악하는 능력은 Google이 약간 앞서는 것으로 보임. 번역문은 P를 채택하되 일부는 G의 것을 취하기로 함


2) LegalTech가 변호사의 일자리를 빼앗는 것은 아니다. 변호사는 여전히 변호사의 역할을 해야 한다. Legalzoom은 변호사와 고객을 연결하는 기술을 계속 개발해 가고 있다. 우버가 택시 기사에게 별점을 매기는 시스템처럼 Legalzoom은 고객이 상담받은 변호사를 점수 매기게 하고 있다. 점수가 쌓이면 고객이 상담받을 변호사를 선택하는 데 도움이 된다. 변호사들도 직접 개인 고객을 찾아 나서는 것보다 좋은 평가를 많이 받아 고객이 많이 찾아오게 하는 편이 훨씬 편하다. 자연스럽게 변호사들도 '고객을 응대하는' 태도를 배우고 친절한 서비스를 제공하게 된다. 어떤 식으로든 기술이 변호사의 일 자체를 위협하지 않는다.


Google: LegalTech is not taking lawyers' jobs. Lawyers still have to act as lawyers. Legalzoom continues to develop technology that connects lawyers and clients. Like Uber's rating system for taxi drivers, Legalzoom lets customers rate the lawyers they consult. The accumulated points help the client choose the lawyer to consult with. It is much more convenient for lawyers to receive many good reviews and attract more clients than to personally seek out individual clients. Naturally, lawyers also learn the attitude of 'serving customers' and provide friendly service. In no way does technology threaten the lawyer's work itself.


Papago: LegalTech does not deprive lawyers of their jobs. A lawyer still has to act as a lawyer. Legalzoom continues to develop technologies that connect lawyers and customers. Just like Uber's system that stars taxi drivers, Legalzoom allows customers to score lawyers consulted. The accumulation of the scores helps customers choose a lawyer to consult. It is much more convenient for lawyers to receive more good reviews than to find individual customers in person. Naturally, lawyers also learn how to 'take care of customers' and provide friendly services. In no way does technology threaten the lawyer's job itself.


DeepL: LegalTech is not taking away lawyers' jobs. Lawyers still need to be lawyers. Legalzoom continues to develop technology to connect lawyers and clients. Like Uber's star rating system for taxi drivers, Legalzoom allows clients to rate the lawyers they consult with. As the scores accumulate, they help clients choose which lawyers to consult. It's much easier for lawyers to get a lot of good reviews and have clients come to them than it is for them to go out and find private clients. Naturally, lawyers learn to be "client-facing" and provide friendly service. In no way does technology threaten the job of a lawyer.

Comment: Google, DeepL과 Papago의 번역례 큰 차이가 없으나 알기 쉽게 간결명료한 것은 Google이 뛰어남


3) 법률 시장에서 가장 중요한 것은 정확성이다. 속도보다는 정확성에 최우선 순위를 두고 기술을 개발해 나간다. 재미있는 사실은 이용자 수가 늘면서 점점 더 품질이 좋아진다는 것이다. 일반적으로 개인 변호사는 연간 5~10건의 기업 안건을 맡아 처리한다. Legalzoom은 직원 600명과 변호사들이 AI의 도움을 받아 매일 수천 개의 기업 서류를 미국 전역의 지방법원과 고등법원, 대법원에 제출한다. 우리처럼 매일 수천 건의 서류를 제출하는 곳에서 오류가 생기면 파장이 크기 때문에 수시로 미국 전역의 법률 정보 변화를 수집해 그 정보를 시스템에 업데이트해야 한다. 법원도 다양한 정보를 Legalzoom에 빠르고 정확하게 알려온다. 규모의 경제가 가져오는 네트워크 효과다.


Google: The most important thing in the legal market is accuracy. Prioritize accuracy rather than speed and develop technology. An interesting fact is that as the number of users increases, the quality gradually improves. Typically, a private attorney handles between 5 and 10 corporate cases per year. Legalzoom's 600 employees and lawyers, powered by AI, submit thousands of corporate documents every day to district, superior, and supreme courts across the United States. If an error occurs in a place where thousands of documents are submitted every day like us, the ripple effect is large, so we must collect changes in legal information across the United States from time to time and update the information to the system. The court also provides various information quickly and accurately to Legalzoom. The network effect brought about by economies of scale.


Papago: The most important thing in the legal market is accuracy. We develop technologies with a top priority on accuracy rather than speed. The interesting fact is that the quality is getting better as the number of users increases. In general, individual lawyers handle 5 to 10 corporate agendas per year. Legalzoom has 600 employees and lawyers submitting thousands of corporate documents to district courts, high courts, and Supreme Court across the United States every day with the help of AI. Because errors in thousands of documents submitted every day, such as ours, have a huge impact, legal information changes across the United States should be collected and updated in the system from time to time. Courts also provide various information to Legalzoom quickly and accurately. This is the network effect of economies of scale.


DeepL: In the legal market, accuracy is everything. We prioritize accuracy over speed as we develop our technology. The interesting thing is that as the number of users increases, the quality gets better and better. Typically, an individual lawyer takes on 5 - 10 corporate matters per year. At Legalzoom, our 600 employees and attorneys file thousands of corporate filings every day with the help of AI in district, high, and Supreme Courts across the United States. When you're filing thousands of documents every day, the impact of an error can be devastating, so we have to constantly gather legal changes from around the country and update our system with that information. The courts also provide us with a variety of information quickly and accurately. It's a network effect of economies of scale.


Comment: Google, DeepL은 몇 군데 오해를 살 수 있는 번역을 했으나 문장이 깔금. Papago는 알기 쉽게 설명. 일부 DeepL 것을 참고하여 Papago 번역을 채택함


* AI 번역기의 괄목할 만한 발전으로 위협받게 된 직종. 출처: 지하철역 구내 광고

4) Intellicon은 2019년에는 인간과 AI의 역사적인 첫 법률 자문 대결, ‘알파로 경진대회’에서 인간 변호사팀에 압승을 거두기도 했다. 인간 변호사 2인 1조로 구성된 ‘변호사팀’과 AI의 자문을 받는 변호사로 구성된 ‘혼합팀’이 각각 최저임금법이나 기간제법, 미성년자나 파견근로자 보호법 등 근로계약과 관련된 법률 자문을 얼마나 빠르고 정확하게 하는지를 두고 대결을 펼쳐 심지어는 물리학 전공 IT엔지니어가 AI의 판례 추천과 법률 검색 서비스를 활용해 인간 변호사팀을 물리쳤다.

2020년 20여 리걸테크 기업은 리걸테크산업협의회를 출범시켰다. 이들은 법률서비스의 접근성과 생산성 혁신을 위해 공동의 노력을 기울이는 데 합의하고, 기술발전과 관련 제도 개선을 도모하기로 했다.


Google: In 2019, Intellicon won a landslide victory over a human lawyer team in the historic first legal consultation match between humans and AI, the "Alpharo Contest." The 'Attorney Team' consisting of two human lawyers and the 'Mixed Team' consisting of AI-assisted lawyers provide legal advice related to labor contracts, such as the Minimum Wage Act, the Fixed-Term Act, and the Protection of Minors and Dispatched Workers Act, respectively. In a confrontation, an IT engineer majoring in physics even defeated a human lawyer team by using AI's precedent recommendation and legal search service.

In 2020, 20 legal tech companies launched the Legal Tech Industry Council. They agreed to make joint efforts to innovate the accessibility and productivity of legal services, and to promote technological development and related institutional improvement.


Papago: In 2019, Intellicon won a landslide victory over the human lawyer team in the 'Alpharo Competition', the first historical legal advisory competition between humans and AI. A "lawyer team" composed of two human lawyers and a "mixed team" consisting of lawyers consulted by AI competed against each other over how quickly and accurately legal advice related to labor contracts such as the Minimum Wage Act, Fixed-term Act, and the Protection of Minors and Dispatched Workers Act.

In 2020, more than 20 Legal Tech companies launched the Legal Tech Industry Council. They agreed to make joint efforts to innovate accessibility and productivity of legal services, and to promote technological development and improvement of related systems.


DeepL: In 2019, Intellicon defeated a team of human lawyers in the AlphaLaw Competition, the first ever legal advice battle between humans and AI. Two teams of human lawyers and a mixed team of AI-assisted lawyers competed to see how quickly and accurately they could provide legal advice related to labor contracts, such as minimum wage laws, fixed-term contracts, and laws protecting minors and temporary workers. An IT engineer majoring in physics defeated the human team using AI's case recommendations and legal search services.

In 2020, more than 20 legal tech companies launched the Legal Tech Industry Council. They agreed to make joint efforts to revolutionize access and productivity of legal services, and to promote technological advancements and related institutional improvements.


Comment: Google Papago DeepL 모두 번역의 질 우수. Papago는 한 문장 누락. 일부 수정은 요하지만 이해가 쉽다는 점에서 Papago 판정 승.


5) LBox는 2023년 3월 신용보증기금의 유망 스타트업 보증 제도인 ‘퍼스트펭귄’에 선정되었다. LBox는 전국 각급 법원 판결문, 참고문헌, 판결 관련 뉴스 등을 일괄적으로 검색할 수 있는 법률 데이터 검색 서비스를 제공하는 리걸테크 기업이다. 총 200만 건의 국내 최다 판례가 등록된 압도적인 데이터베이스에 인공지능 기술을 활용한 강력한 검색 기술을 적용하여 대형로펌과 법인기업을 회원들로 유치해 국내 최고의 판결문 검색서비스로 평가받고 있다.


Google: In March 2023, LBox was selected as the ‘First Penguin’, a promising startup guarantee system by the Korea Credit Guarantee Fund. LBox is a legal tech company that provides a legal data search service that allows users to collectively search for court rulings, references, and news related to court decisions at various levels across the country. It is evaluated as the best judgment search service in Korea by attracting large law firms and corporations as members by applying powerful search technology using artificial intelligence technology to an overwhelming database with a total of 2 million cases registered, the largest number of cases in Korea.


Papago: LBox was selected as the 'First Penguin', a promising startup guarantee system of the Korea Credit Guarantee Fund, in March 2023. LBox is a legal tech company that provides legal data search services that can collectively search for court rulings, references, and news related to rulings at various levels across the country. It is considered the best judgment search service in Korea by attracting large law firms and corporate companies as members by applying strong search technology using artificial intelligence technology to the overwhelming database with a total of 2 million cases registered in Korea.


DeepL: LBox was selected as a "First Penguin," a promising startup guarantee program of the Credit Guarantee Fund in March 2023. LBox is a legal data search service that enables users to search court judgments, references, and judgment-related news from all levels of courts nationwide. It has attracted large law firms and corporations as members by applying powerful search technology utilizing artificial intelligence technology to an overwhelming database with a total of 2 million Korean judgments, and is regarded as the best judgment search service in Korea.


Comment: DeepL은 번역이 아주 매끄러운 편. 두루뭉술 처리하지 않고 꼼꼼하게 번역하는 것은 Google이 Papago보다 나음. 이런 경우에는 DeepL이나 Google의 번역례를 채택함



한국식 뉘앙스를 잘 표현하는 Papago 번역을 일단 기본으로 채택하되 나머지는 DeepL, Google translator의 번역례를 참조하여 수정하기로 했다. 위에서 살펴본 바와 같이 구어체 문장은 Papago가 낫다고 보나, 시간이 지날 수록 전문성 있는 콘텐트는 DeepL, Google을 더 많이 참조하게 되었다.[2][3]

이런 식으로 AI 번역기를 적절히 활용한다면 KoreanLII 기사의 번역에 별 부담없이 완벽을 기할 수 있을 것으로 판단된다. 위의 실험 결과는 미완성 부분의 번역을 완료함으로써 Unfinished Article(현재 단 3개)에서 LegalTech 항목을 지운 해당 사이트 참고. 그러나 당분간 신뢰도와 정확성을 기한다는 견지에서 영문 법령(Statutes)과 대법원 및 헌법재판소의 판결(Court rulings)은 요지만 번역하고 법제연구원, 법원도서관과 헌재의 공식 번역이 나올 때까지 기다리기로 했다.



1] 조선일보, "AI 번역, 구어체는 ‘파파고’ 비즈니스 영어는 ‘DeepL’", 2023. 3. 16.


2] 개인적으로 DeepL과 Google 번역기의 비중을 높인 이유는 번역의 정확도(accuracy) 면에서 수많은 언어의 말뭉치(corpus)를 가지고 학습하는 Google (2023. 4. 현재 133개 언어 서비스)과 DeepL(한국어 포함 31개 언어 서비스)의 발전속도가 워낙 빠르게 느껴졌기 때문이다. 말하자면 전세계의 도서관 장서를 DB로 갖춘 Google이나, 유럽의 거의 모든 언어를 교차 번역해 놓은 말뭉치를 데이터로 학습한 DeepL이 압도적으로 우세한 지위를 점할 수밖에 없다.

DeepL은 EU 회원국의 언어가 모두 공식언어이기 때문에 모든 공식문서는 24개 이상의 언어로 번역하여 보존해야 하는 관계로 기계학습을 해온 말뭉치가 정확하고 풍부한 것이 특색이다. 또한 다른 번역기와는 달리 곡선형 신경망(convolutional neural networks: CNNs)을 채용하여 정확도 면에서도 앞선다. 현재 DeepL의 본사는 독일 쾰른에 있지만 그의 슈퍼컴퓨터는 전력요금이 매우 싼 아이슬란드에 자리잡고 있다.


3] 조선일보, "번역시장 돌풍 일으킨 ‘딥엘’ 창업자 쿠티워프스키 방한" -- 구글 이긴 매끄러운 번역… 딥엘 창업자 “한국어, 세계 5大시장 될 것”, 2023. 5. 10.