생성형 AI를 활용한 언어교육 연구의 동향과 전망 -토픽 모델링과 키워드 분석을 중심으로
Trends and Prospects of Language Education Research Using Generative AI : Focusing on Topic Modeling and Keyword Analysis
Article information
Abstract
본 연구의 목적은 인공지능을 활용한 언어교육의 최신 연구 동향을 분석하여, 생성형 인공지능이 언어교육에서 활용 가능성과 전망을 살펴보는 데 있다. 이를 위하여 한국학술지인용색인(KCI)와 학술연구정보서비스(RISS)에 게재된 학술지, 학위 논문을 상세 검색하여 연구 대상을 수집하여 통계적 분석과 LDA 기반 토픽 모델링(Topic Modeling) 기법으로 언어교육에서 생성형 인공지능을 활용한 연구 주제에 대해 분석하였다. 이를 분석 결과 92편의 연구는 ChatGPT 3.0이 개발된 2023년 이후 급격히 증가하였고, 주로 생성형 AI를 활용한 연구가 주를 이룬 것으로 나타났다. 언어권별로는 한국어를 주제로 한 연구가 가장 많았으며, 그다음으로 영어, 독일어 순이었다. 토픽 모델링 기법을 사용하여 92편 학술 문서를 키워드 분석한 결과 생성형 인공지능에 대한 학술 논문에서는 ‘교육’, ‘생성’, ‘활용’, ‘인공지능’, ‘학습’ 등이 가장 많이 나타났다. 이런 연구 결과를 바탕으로 실제 언어교육에서 생성형 AI의 활용 사례를 국내외로 살펴보고, 언어교육 현장에서 그 활용 가능성을 알아보았다. 그리고 언어교육에서 생성형 인공지능을 활용 시 문제점을 제시하고 이를 해결하기 위한 방안을 제안하였다.
Trans Abstract
The purpose of this study is to analyze the latest research trends in language education using artificial intelligence, focusing on the potential and prospects of generative artificial intelligence in this field. To achieve this, academic journals and dissertations published on the Korea Citation Index (KCI) and the Academic Research Information Service (RISS) were thoroughly searched to collect subjects for research, which were then analyzed using statistical methods and LDA-based topic modeling techniques. The analysis showed a significant increase in research, with 92 studies emerging after the development of ChatGPT 3.0 in 2023, predominantly focusing on the use of generative AI. The majority of these studies were focused on the Korean language, followed by English and German. Keyword analysis of the 92 academic documents using topic modeling techniques revealed that terms such as ‘education’, ‘generation’, ‘utilization’, ‘artificial intelligence’, and ‘learning’ were most frequently used. Based on these findings, the study examines practical examples of generative AI use in language education both domestically and internationally, explores its potential in the educational field, identifies challenges when utilizing generative AI in language education, and proposes solutions to address these issues.
1. 서론
이 연구의 목적은 생성형 AI를 활용한 언어교육의 최신 연구 동향과 교육적 활용 사례를 살펴보면서 생성형 인공지능이 언어교육에서 활용 가능성과 전망을 살펴보는 데 있다.
인류는 기원전 수렵 채집 사회에서 농경 사회로의 전환된 첫 번째 패러다임의 변화를 통한 이후 산업 혁명, 정보화 사회 등 여러 번의 패러다임이 변화하면서 발전해 왔다. 21세기 들어 인공지능 기술의 급격한 발전으로, 기계 학습, 딥러닝, 생성형 AI 등이 다양한 분야에 도입되었다. 이런 인공지능 기술의 발전은 산업 전반에 자동화가 확대되었으며 기존 직업이 변화하고, 새로운 직업군이 생성되었다. 이에 따라 현대 사회 구조와 생활 방식 등이 변화하고 있으며, 윤리적, 사회적 문제가 대두되어 이에 대한 연구와 논의가 이뤄지고 있다. 농경 사회부터 인공지능 사회까지 오는 동안 각 패러다임의 변호는 인류에게 새로운 기회와 도전을 제공하였으며, 인류가 발전하는데 중요한 원동력이 되었다.
최근 생성형 인공지능 기술의 발전은 다양한 분야에 혁신을 가져오고 있으며, 특히 교육 분야에서 그 가능성이 주목받고 있다. 이에 따라 생성형 인공지능의 교육적 활용에 관한 연구가 활발히 진행되고 있다. 국외 연구에서 Bozkurt(2023)는 생성형 인공지능이 교육을 포함한 여러 분야에 걸쳐 광범위한 영향을 미칠 것이라고 예측하며, 특히 프롬프트 엔지니어링이 디지털 리터러시의 중요한 요소로 떠오를 것이라고 언급했다. Rudolph, Tan, & Tan(2023)와 Kasneci(2023)에서도 ChatGPT가 교수자의 작업 부담을 감소시켜 업무를 처리하는 데 있어서 더 효율적으로 도와줄 수 있다고 하였다.
또한 생성형 인공지능 기술이 교수 학습 방법에 깊은 영향을 미칠 수 있으며, 새로운 사고방식의 필요성을 강조하였다. 그리고 Mello 외(2023)는 생성형 인공지능이 교육의 질을 향상시키고 학습자의 역량을 강화하며 개별화된 학습을 지원할 수 있는 잠재력을 지니고 있지만, 이를 실현하기 위해서는 교육 관계자 간의 유기적인 협력이 필요한 연구와 노력이 중요하다고 하였다. 국내 연구에서는 이수환 외(2023)에서 68편의 생성형 인공지능 연구들을 분석한 결과 국내는 ChatGPT를 중심으로 활발히 진행되고 있는 것이 특징이며, 주로 생성형 인공지능을 활용한 교수⋅학습 방법, 각 교과에 적용할 수 있는 방안, 생성형 인공지능 시대의 교육 방향과 인재상, 교사 보조 도구로서의 활용 방안, 그리고 인공지능 시대의 교육 정책에서 발생하는 문제점 탐색 등을 연구 주제로 다루고 있다고 정리하였다.
생성형 인공지능은 교육 분야 가운데 언어교육에 있어서도 기존의 학습 방식을 획기적으로 변화시킬 잠재력을 지니고 있다. 전통적인 언어교육 방식은 교사 중심의 강의와 교재 중심의 학습이 주를 이루었지만, 생성형 AI는 이를 보완하거나 대처하여 학습자들의 언어 능력 향상에 도움을 줄 뿐만 아니라, 새로운 학습 경험을 제공할 수 있다. 언어교육은 단순히 지식 습득을 넘어 글로벌 시대를 살아가는 개인의 성장에 필수적인 역할을 한다. 최근 몇 년간 생성형 인공지능의 발전은 언어교육의 방법론과 도구에 큰 변화를 가져왔다. 이 연구는 생성형 인공지능이 언어교육에 가져올 혁신적인 변화를 심층적으로 분석하기에 앞서 우선 언어교육에서 생성형 AI를 활용한 연구의 동향을 살펴보고자 한다. 그리고 실제 교육 현장에서 생성형 인공지능의 활용 사례를 통해 교육 현장에서 사용될 새로운 도구로서의 가능성을 확인하여 생성형 인공지능이 어떻게 학습 효과를 극대화하고, 학습자의 능동적인 참여를 유도하는지 알아볼 것이다. 또한, 생성형 인공지능 활용에 따른 윤리적 문제, 기술적 한계 등 앞으로 해결해야 할 과제들을 중심으로 미래 언어교육의 모습을 전망하려고 한다. 이런 변화에 발맞춰 교육 현장과 교사, 학습자가 어떻게 준비해야 할지에 대한 시사점을 제시하고자 한다.
2. 생성형 인공지능 활용한 언어교육 연구 동향
2.1. 연구 대상 및 방법
언어교육에서 생성형 인공지능을 활용한 연구 동향을 알아보기 위해 연구 대상을 2024년 8월 1일까지 ‘한국학술지인용색인(KCI)’와 ‘학술연구정보서비스(RISS)’에 게재된 학술지, 학위 논문이며, 1차 검색어로 검색한 후 상세 검색을 하여 연구 대상을 수집하였다.
우선 1차 검색어로 ‘생성형 인공지능, 생성형 AI’를 활용하였으며, 상세 검색으로 ‘언어교육, 외국어교육, 한국어교육, 영어교육’의 2차 검색어를 활용하여 논문을 수집하였다. 수집한 학술지 논문은 321편, 학위 논문은 49편으로 총 370편으로 정리되었다. 이 가운데 중복 논문과 언어교육과 직접 관련 없는 논문 등 연구 목적에 적합하지 않은 논문을 제외하여 최종적으로 학술지 논문 79편, 학위 논문 13편 총 92편을 선정하였으며 수집한 결과는 <표 1>과 같다.
선정한 92편의 논문을 1차적으로 연구 시기, 연구 유형, 연구 관련 언어권별 유형 등으로 나누어 통계적으로 분석하였다. 그리고 LDA 기반 토픽 모델링(Topic Modeling) 기법으로 언어교육에서 생성형 인공지능을 활용한 연구 주제에 대해 분석하였다. 잠재 디리클레 할당(LDA)은 텍스트 문서가 다양한 주제들의 조합으로 이루어져 있다는 가정하에, 각 문서에 숨겨진 주제를 추론하고 단어들의 분포를 모델링하는 확률적 기법으로, 본 연구에서는 생성형 AI를 활용한 언어교육 연구를 LDA(Latent Dirichlet Allocation) 문서 집합에서 주제를 발견하는 토픽 모델링 기법을 사용하여 92편 학술 문서를 분석하였으며, Bow 기법이 사용하였다1).
2.2. 통계 분석 결과
우선 선정한 92편의 논문을 연구 시기, 연구 유형, 연구 관련 언어권별 유형 등으로 나누어 통계적으로 분석하였다. 항목별 결과는 아래와 같다.
2.2.1. 연구 시기
언어교육에 생성형 인공지능을 활용한 연구 시기를 정리하면 [그림 1]과 같다. 2021년에 학술지 논문에 1편이었던 것이 2023년에는 48편으로 급격히 증가하였다. 이수환 외(2023)에서도 생성형 인공지능에 대한 연구가 등장한 것은 2020년이나 2022년까지 연구 동향에 유의미한 변화가 없다가 이 연구 결과와 유사하게 2023년에 급격하게 증가한 것으로 나타났다. 이와 같은 결과는 2023년 3월에 ChatGPT 3.0, 3.5가 잇달아 공개되면서 관심이 집중된 것으로 보인다. 그리고 2023년부터 석사 학위 논문이 3편이 나오기 시작하여 2024년 8월까지 총 13편의 학위 논문이 나왔다.
2.2.2. 연구 유형
언어교육에서 생성형 인공지능의 활용 가능성과 효과성에 관한 활용 연구가 69%를 차지하였고, 생성형 인공지능에 언어교육에 미치는 영향과 그에 대한 교수나 학습자의 인식 조사 등과 같은 기초 연구가 30%를 차지하는 것으로 나타났다. 특히 학술지 논문보다 학위 논문에서 언어교육에 생성형 인공지능을 활용했을 때의 가능성과 효과성의 비율이 높았다. 그리고 인식 조사에 대한 연구는 학술지 논문에서 많이 다루어졌으며 주로 학습자의 인식 연구보다 교수자에 대한 인식 조사 연구가 더 많았다. 연구 유형에 따른 결과를 정리하면 [그림 2]와 같다.
2.2.3. 언어권별 연구
언어교육에서 생성형 인공지능을 이용한 연구를 언어권별로 정리해 보니 (한)국어를 주제로 한 연구가 44편으로 가장 많았다. 국내 연구를 중심으로 분석한 결과이기는 하나, 다른 외국어 교육 분야에서도 연구가 이루어지고 있었다. 그 가운데 영어가 16편, 독일어 3편 순으로 많았으며, 프랑스어, 일본어, 스페인어, 중국어 등 다양한 언어권별로 연구가 진행된 것을 확인할 수 있었다. 그 결과를 정리하면 [그림 3]과 같다. 그리고 교육 단계별로 정리하면 중등교육보다는 초등교육을 대상으로 하는 연구가 많았으며, 대학 교육이 가장 많았다2). 대학 교육에서 생성형 인공지능을 활용한 언어교육에 미치는 영향과 가능성을 알아보는 연구가 많았다. 그 가운데 주로 쓰기에 관한 연구가 읽기나 말하기에 비하여 상대적으로 많았다.
2.3. LDA 기반 토픽 모델링 분석 결과
생성형 AI를 활용한 언어교육 연구를 LDA(Latent Dirichlet Allocation) 문서 집합에서 주제를 발견하는 토픽 모델링 기법을 사용하여 92편 학술 문서를 분석하였으며, Bow 기법이 사용되었다. 92편의 총 단어 수는 13,319개였으며 BoW 모델에서 LDA 생성은 5개의 토픽으로 지정하였다. 생성에 사용된 매개변수는 먼저 의미 모델이 수렴할 수 있는 충분한 학습을 보장하기 위해서 전체 코퍼스를 100회에 걸쳐 학습하였고, 토픽 분포와 단어분포 업데이트를 500회 지정하였다. 이런 과정을 통해 나온 빈도 분석 결과는 <표 2>와 같다.
키워드 분석 결과 92편의 언어교육에 생성형 인공지능에 대한 학술 논문에서는 ‘교육’, ‘생성’, ‘활용’, ‘인공지능’, ‘학습’ 등이 가장 많이 나타났으며, 최상위 빈도를 차지하고 있음을 확인할 수 있다. 키워드 분석기법인 빈도분석에서 가장 많이 출현한 상위 20개 주요 단어를 워드 클라우드 분석기법으로 시각화하였다. 워드 클라우드 분석 결과는 [그림 4]와 같으며, 워드 클라우드 분석 결과, ‘생성’을 중심으로 ‘교육’, ‘활용’이 굵고 큰 글씨로 중앙에 위치하고 있음을 볼 수 있다. 키워드 분석 결과, 인공지능과 직⋅간접적으로 관련된 학술 논문에 대한 전반적인 흐름은 ‘생성형 인공지능’, ‘교육 활용’ 등에 대한 연구가 주를 이루었음을 알 수 있었다.
LDA 토픽 모델링을 적용하여 5개 토픽과 각 토픽에 포함되는 단어 중 토픽 내에서 가중치가 0.01 이상인 단어들을 토픽을 대표하는 키워드로 추출하였으며 그 결과는 <표 3>과 같다.
언어교육에서 생성형 인공지능에 대한 학술 논문은 ‘인공지능과 교육 연구 및 적용’, ‘학생 학습 평가 및 감상문 분석’, ‘AI 기반 영어 교육과 도구 활용’, ‘AI 대화 및 번역 시스템 연구’, ‘디지털 시대의 문학 창작과 리터러시 교육’ 순으로 연구 비중이 나타났다.
각 토픽에 대한 설명을 정리하면 우선 토픽 1은 인공지능을 교육 현장에서 어떻게 활용하고 연구하는지에 관한 것이다. AI를 활용한 학습 방식, 수업 도구, 그리고 교육 연구 등에 중점을 둔 주제가 주로 다루어진 것으로 분석할 수 있다. 특히, 인공지능을 활용한 콘텐츠 생성, 개인 맞춤형 학습, 교육 데이터 분석 등에 대한 연구가 활발하게 진행되고 있다.
토픽 2는 학생들의 학습 성과를 평가하고, 감상문이나 에세이와 같은 학습 자료를 분석하는 것에 중점을 두고 있다. 즉, 학생들의 학습 데이터를 분석하여 학습 성과를 향상시키기 위한 연구를 다루고 있으며, 학생들의 과제, 시험 결과 등을 분석하여 개인별 학습 약점을 파악하고, 이를 바탕으로 맞춤형 학습 지도를 제공하는 방법에 대한 연구가 주를 이룬다고 볼 수 있다.
토픽 3은 AI를 활용한 영어 교육과 관련된 내용으로, 영어 학습을 위해 AI 도구를 어떻게 활용하는지, 교사와 학생 간의 상호작용, 질문 생성 등과 관련된 연구들이 포함된다. 특히, 영어 교육 분야에서 인공지능 챗봇을 활용한 대화형 학습, 자동 채점 시스템 개발 등에 대한 연구가 주를 이루는 것으로 볼 수 있다.
토픽 4는 챗봇과 같은 AI를 활용한 대화 시스템과 번역 시스템 연구에 관한 것으로. 텍스트 생성, 번역 오류 수정, 한국어 처리 등과 관련된 내용이 포함된다. 학생들이 텍스트나 음성 대화를 통해 언어를 학습하고, 그 과정에서 발생하는 오류를 피드백하여 개선하는 과정이 포함되며, 한국어와 같은 특정 언어의 학습과 번역 시스템의 정확성을 향상하는 연구도 진행되고 있는 것을 알 수 있다.
끝으로 토픽 5는 인공지능 기술이 교육에 미치는 영향과 미래 교육의 모습에 대한 전망을 다루고 있는 것으로 볼 수 있다. 인공지능을 활용한 창의적 글쓰기 교육, 디지털 리터러시 교육 등 새로운 교육 패러다임에 대한 논의가 이루어지고 있으며 주로 AI를 활용한 문학 창작 교육에 관한 연구가 진행되고 있다. AI를 통해 글쓰기를 배우거나 문학적 리터러시를 개발하는 교육 방식과 관련된 연구들을 포함하며, 디지털 리터러시와 관련된 내용도 다루고 있는 것이다. 이는 인공지능을 활용한 창의적 글쓰기 교육과디지털 리터러시 교육 등 새로운 교육 패러다임에 대한 논의가 되고 있는 것으로 분석할 수 있다.
토픽모델링 분석 결과 인공지능은 모든 교육 주제에서 핵심 키워드로 등장하며, 이를 활용한 다양한 교육 방법론과 도구 개발에 대한 연구가 활발하게 진행되고 있었다. 무엇보다 학생 개개인의 특성과 학습 수준에 맞춘 맞춤형 학습이 중요한 주제로 부각되고 있으며, 이를 위하여 인공지능 기반 데이터 분석 기술이 활용되고 있는 것으로 나타났다. 또한, 인공지능을 통해 기존 교육 콘텐츠와 평가 방식을 바꾸고, 더 효과적인 학습 환경을 구축하려는 노력도 이루어지는 연구가 진행되고 있었다. 그러나 이러한 기술 발전과 함께 교육 현장에서 발생할 수 있는 윤리적 문제에 대한 고민도 동시에 다뤄져야 하는 연구도 같이 진행되고 있다는 것에서 인공지능 윤리 문제는 앞으로 계속 진행될 것으로 판단된다.
3. 언어교육에서 생성형 인공지능의 활용 사례
생성형 인공지능이 언어교육에 있어서 가지고 있는 잠재력은 언어교육 전공자가 아닌 일반인들은 쉽게 유추할 수 있다. 현재 누구나 접근할 수 있는 ChatGPT로 대표되는 생성형 인공지능 기술을 이용하여 언어교육에서 활용될 수 있는 것을 정리하면 다음과 같다.
생성형 인공지능은 학습자의 수준과 요구에 맞춘 개인화된 학습 자료를 생성할 수 있으며 이를 통하여 학습자는 자신에게 가장 적합한 학습 방법, 학습 속도 등을 조절할 수 있다. 현재 나온 생성형 인공지능으로 학습자는 자신의 어휘 수준에 맞는 읽기 자료를 제공해 달라고 하거나 특정 문법 항목에 대해 집중적으로 연습할 수 있는 연습 문제를 만들어 달라고 요구할 수 있다. 그리고 자신의 쓴 텍스트나 발화에 대해 인간 교사와 달리 자신이 원하는 시간에 피드백을 받고 교정할 수 있다. 한 명의 교사가 다수의 학습자를 상대하는 보통의 외국어 교수-학습 상황에서 교사가 학습자의 쓰기 텍스트를 실시간으로 문법이나 어휘의 오류를 수정해주고 적절한 문법이나 어휘를 제공해 주기에는 물리적으로 한계가 있다. 위 두 가지 상황을 보면 생성형 인공지능은 언어교육에 있어서 학습자 수준에 맞는 개별 학습이 가능하다는 것이다. 이는 말하기 연습 상황에서도 한정된 대화 상대자와 대화 상황을 무한히 확장시킬 수 있다. 교사와 학습자, 학습자와 다른 학습자 간의 대화 연습을 성별, 인종별, 연령별에 따른 인적 구성부터 도서관, 식당, 백화점 등 대화가 일어나는 장소는 물론 사과하기, 제안하기, 요구하기 등 대화 상황도 교재에 다르게 여러 상황을 가상으로 체험할 수 있다.
비단 학습자에게만 잠재력이 있는 것이 아니라 교사들이 이용할 수 있는 잠재력도 크다. 생성형 인공지능을 이용하여 더 쉽게 교육용 자료를 만들 수 있으며, 학습자 수준에 따른 수업 계획서 수정, 간단한 퀴즈, 읽기 자료를 자동으로 생성하여 교수 학습 준비 시간을 줄일 수 있다. 또한 학습자 평가를 위한 평가 문항을 만들 때도 문법이나 어휘 항목의 검색, 활용 등에도 이용될 수 있다. 이런 생성형 인공지능의 잠재력이 언어교육에서 교사와 학습자에게 다수의 장점을 보이지만, 실제 교수 학습 상황에서 이를 이용한 사례를 찾기는 쉽지 않다. 최근 들어 생성형 인공지능을 활용한 교육 사례가 학술대회에서 발표된 것을 중심으로 국내와 국외로 나누어 살펴보고자 한다.
3.1. 국내 사례
국내에서는 주로 생성형 인공지능의 언어교육에서 활용 가능성이 있는지를 알아보기 위한 실험 연구는 꾸준하게 이루어지고 있지만, 교수자가 생성형 인공지능을 활용한 학습 도구를 개발하여 지속적으로 수업 시간에 이용한다거나 학습자들이 생성형 인공지능을 활용하여 과제를 제출하는 등의 사례는 많지 않다. 아래 사례는 본격적으로 대학 교양 글쓰기 수업에서 생성형 인공지능을 활용한 수업으로 볼 수 있다.
백혜선(2024)은 ‘AI 글쓰기 피드백을 활용한 글쓰기 수업 사례 연구’에서 C 대학에서 <사고와 글쓰기>라는 교과목에서 ‘AI 글쓰기 피드백 프로그램’을 활용한 수업 사례를 연구하였다. 이 연구는 2024학년도 1학기부터 C 대학 기초교양 수강생 1,500명을 대상으로 진행하였으며, ChatGPT와 같은 생성형 인공지능의 등장으로 글쓰기 교육 방식의 변화된 흐름 속에서 AI를 활용한 글쓰기 피드백 프로그램이 학습자의 글쓰기 향상에 도움이 되는지 그 효과를 알아본 연구이다. 연구가 학기 중반까지 된 내용으로 정리한 중간 연구 결과로 2개 분반에서 ‘추천 콘텐츠 한 문단 쓰기’ 과제를 통해 AI 피드백 프로그램을 적용하고, 학생들의 반응과 피드백 내용을 분석하였다.
연구 결과 AI 프로그램은 학생들에게 13가지 장르에 맞춘 평가와 피드백을 제공하며, 학생들은 평균 8.8회 글을 수정하였고, 학습자들 81%가 AI 피드백 프로그램이 글쓰기에 도움이 된다고 응답하였다고 밝혔다. 특히 ‘내용 분석’이 유용하다는 반응이 많은 것으로 나타났으며,고 예비 조사에서 글쓰기 피드백 프로그램을 사용한 학생의 글쓰기가 평균적으로 향상된 것을 확인하였다. 하지만 학기 중반까지 연구된 연구 결과로 AI 글쓰기 피드백 프로그램은 학생들이 다양한 관점에서 글을 개선하도록 도와주지만, 프로그램의 평가 기준 조정과 맞춤법 및 띄어쓰기 중심으로만 피드백이 이루어진 한계가 있다.
실제 교육 기관에서 글쓰기 피드백 프로그램을 활용하고 이를 연구한 것으로 주로 생성형 인공지능의 가능성에 대한 연구에서 벗어나 실제 교수-학습 상황에서 적용하고 학습자의 인식까지 조사한 사례로 의의가 크다고 할 수 있겠다. 하지만 학기 중반까지의 중간 연구 결과에 그치고, 실제 학생들의 글쓰기 능력에 향상이 도움이 되었는지는 나오지 않아 결과에 대한 후속 연구가 이루어져야 할 것이다.
위의 백혜선(2024)와 같이 언어교육에서 생성형 인공지능의 활용을 눈여겨보고 있는 분야가 바로 ‘쓰기’이다. 그 가운데 ‘쓰기 평가’의 자동 채점에 대한 연구는 국내외에서 지속적으로 이루어져 왔다. 쓰기 자동 채점에 대한 연구는 1960년대 PEG(Project Essay Grade)가 개발된 이후 영어 교육 분야에서 프로그램 개발, 채점 자질 등에 대해 연구되었다. 국내에서는 평가 연구 기관인 한국교육과정평가원에서 주도적으로 수행된 연구(노은희 외, 2013, 2014, 2015, 2016;, 시기자 외, 2014; 진경애 외, 2006, 2007, 2008 등)가 영어 쓰기 평가에 대한 자동 채점 연구가 진행되었다. 이후 ChatGPT로 대표되는 생성형 인공지능 개발이 되면서 본격적으로 자동 채점에 대한 연구가 한국어 교육에서도 시작되었다.(조희련 외 2021; 이용상 외, 2022; 남미정 외, 2022; 남미정; 2023, 이진 외, 2023, 2024; 공나형 외 2024 등) 하지만 대부분 자동 채점 모델의 성능을 비교하거나 검증하는 연구들로 아직은 더 연구가 진행되어야 한다.
그리고 자동 채점 프로그램도 PEG 개발 이후 IEA (Intelligent Essay Assessor), IntelliMetric, BETSY(Bayesia Essay Test Scoring sYstem), E-rater 등이 개발되었으며, 한국어를 기반으로 하는 한국어 에세이 자동 채점 프로그램인 ‘PASTA(Personalized Automated Scoring and Tutoring Assistant)’와 ‘한국어 기반의 디지털 글쓰기 평가 및 학습 엔진’인 ‘키위-KEEwi(Korean Essay Evaluation with AI)’ 등이 등장하여 여러 교육 기관에서 사용되거나 연구에 이용되고 있다. 앞으로 쓰기 평가에서 생성형 인공지능을 활용하는 시기가 멀지 않을 것으로 예상된다.
3.2. 국외 사례
국외에서도 쓰기 수업에 생성형 인공지능을 활용한 사례가 있다. 미시시피 대학교의 글쓰기 강사이자 교육 개발자인 Emily Donahoe는 학생들이 작문 수업에서 과제를 수행할 때 ChatGPT의 활용을 권장하였다. 그녀는 학생들에게 ChatGPT로 자신의 논의하고 싶은 글의 초안을 만든 후 그 초안이 얼마나 효과적인지에 대해 주석을 달게 하였다. 그후 자신의 비평에 기초하여 다시 쓴 글을 제출하게 하였다. 학생들은 ChatGPT로 초안을 작성한 것이 분량을 채우는 것에 대한 부담을 덜었고, 과제의 핵심적인 내용에 집중할 수 있었다고 했다. 그러면서 Donahoe는 “이런 방식으로 과제를 세분화하면 학생들이 주제에서 벗어나지 않고 중요한 단계에 집중하도록 하는 데 도움이 된다”라고 하였다3).
또한 문규원(2024)에서는 2023년부터 2024년까지 Brown 대학의 한국어 교실에서 생성형 AI의 활용한 사례를 연구하였다. 이 연구에서는 인공지능 도구를 교육 시스템에 통합할 때 윤리적 고려사항을 가장 중요하게 생각하였고 교육 환경에서 학습자가 인공지능을 활용할 때 주요 윤리적 지침을 마련하여 [그림 5]와 같이 학습자에게 제시하였다. 이 윤리적 지침은 생성형 인공지능을 공정하고 효과적으로 사용하기 위해서 마련하였으며 실제 교수-학습 상황에서 활용하였다. 연구에서 마련한 윤리 지침은 인공지능 기술에 누구나 공평하게 접근할 할 있는 공정성과 인공지능이 교육 실습에서 학습 과정에 영향을 미치는 방식을 명확하게 인공지능 이용한 학습 과정을 투명하게 전달하는 의사소통의 투명성을 제시하였다. 그리고 인공지능 도구의 모니터링하고 감독하기 위한 책임감과 학문적 부정행위를 해결하기 위해 무결성을 들었다. 이러한 윤리 지침으로 바탕으로 한국어 수업에 적용한 결과 문법 검사, 어휘 향상 및 활동적인 언어 연습과 같은 언어 학습의 다양한 측면을 촉진시키는 결과를 얻었다고 하였다.
4. 생성형 인공지능 활용 시 도전 과제 및 전망
생성형 인공지능이 생성한 언어는 인간의 사용하는 언어와 동일한 것인가에 대한 물음은 OpenAI의 GPT-3가 나온 이전부터 계속되어 왔다. 이를 위하여 인간과 인공지능의 언어 습득과 처리하는 과정에 대하여 같은 양상을 보이는가에 대한 연구는 주로 영어에 초점을 두고 연구되었다.(Linzen & Jaeger, 2016; Linzen & Leonard, 2018; Marvin & Linzen, 2018; Wilcox et al. 2023) 황혜림(2024)에서는 이 연구들의 결과는 언어 현상에 따라 사람과 비슷한 언어 습득과 언어 처리 양상을 보이기도 하지만 다른 양상을 보이기도 한다고 정리하였다.
생성형 인공지능은 대량의 데이터로 훈련된 것을 바탕으로 언어를 생성해 내지만, 여전히 언어의 맥락을 완벽하게 이해하는 데 한계가 있다. 그 예로 같은 말이라도 맥락이나 상황에 따라 다른 의미를 나타내는 것이나 문화적 배경을 고려하지 못하는 경우를 들 수 있다. 이렇게 맥락이나 상황을 고려하지 않으면 학습자는 적절하지 못한 응답이나 오해를 일으킬 수 있는 표현을 연습하고 습득할 수도 있다. 특히 고맥락 언어인 한국어에서 맥락이나 상황에 맞는 표현과 문화적 배경을 생성형 인공지능만으로 한국어를 습득하기에는 어려움이 있고 교육적 효과도 낮을 수밖에 없다. 언어적 맥락과 언어권별 문화적 배경에 따른 언어를 생성해 내는 것은 현재 생성형 인공지능의 기술로 한계가 있으며 더 많은 데이터 구축이 필요해 보인다.
언어교육에서 생성형 인공지능을 활용할 때 넘어야 할 도전 과제는 우선 생성형 인공지능을 언어교육뿐만 아니라 교육 분야에 이용할 때 제기되는 학습자의 ‘학문적 진실성(academic integrity)’과 윤리적인 문제이다. 학습자는 생성형 인공지능을 이용하면 과제 수행을 쉽게 해결할 수 있기에 과제 제출이나 보고서, 연구 결과물을 비판적 사고 없이 문제를 해결할 수 있다. 이는 생성형 인공지능이 제공하는 정보에 지나치게 의존하게 될 경우, 학습자들은 창의적 사고와 비판적 사고 능력을 저하시키게 된다. 또한, 학습자들이 생성형 인공지능의 답변을 그대로 받아들이는 경향이 생기면 스스로 문제를 분석하고 해결하는 능력을 기르는 데 방해가 될 수도 있다. 그리고 생성형 인공지능을 사용할 때 보이는 ‘환각(Hallucination)’ 현상이나 편향성 문제를 반드시 인지하고, 산출된 결과물은 여러 번의 사실 확인을 해 봐야 한다.
이에 대학들은 이런 문제에 대응하기 위해 등장 초기는 사용 금지에서 이제는 학생들의 창의적 활용을 위해 장려하면서 가이드라인을 만들었다. 고려대학교에서 2023년 3월 ‘생성형 AI 활용 수업 가이드라인’을 제정하는 것을 시작으로 중앙대에서도 2023년 4월 ‘생성형 AI 활용 가이드라인’을 제시하면서 ‘교수자’와 ‘학습자’ 구분하여 가이드라인을 제시하였다. 그 뒤 성균관대도 2023년 4월부터 ‘ChatGPT를 활용한 표준형 수업 모델’을 수립하고, ‘ChatGPT 사용 방법’과 ‘사용 예시’를 안내하고 있다. 이후 ‘생성형 AI 가이드라인’을 제시한 대학은 연세대가 2024년 5월에 제시하였으며, 이화여자대학교는 ‘생성형 AI 윤리지침’을 안내하고 있다. 이렇듯 여러 대학 기관에서 생성형 AI 활용 가이드라인은 제시하고 있지만, 인공지능 윤리에 대한 교육은 이뤄지지 않고 있다. 가이드라인은 있지만 그것을 지키고 사용하는 데는 사용자들이 이를 지키지 않는다면 아무런 소용이 없다. 가이드라인을 매우 상세한 운영 지침을 마련하기에 앞서 생성형 인공지능을 이용하는 모든 사람에게 인공지능 윤리 교육이 우선 앞서 진행되어야 할 것이다.
끝으로 생성형 AI를 통한 교육 혜택은 모든 학습자에게 고르게 제공하는 것도 중요한 도전 과제이다. 생성형 AI를 언어교육에서 활용하기 위해서는 접근할 수 있는 기반 시설이 확보되어야 하나, 인터넷이나 기반 시설이 부족할 경우 이를 활용하는 디지털 교육의 격차는 더욱 심화될 수 있다. 안재린(2024)에서 미국 대학 한국어 학습자들을 대상으로 학습 도구에 대해 조사한 결과 ‘종이와 펜’을 사용하는 것이 익숙하다는 학습자는 28.1%에 불과했고, 나머지는 노트북, 테블릿 PC 등 디지털 기기를 학습에 이용하고 더 익숙하다고 하였다. 하지만 한넬리(2024)에서는 디지털화에는 품질관리 시스템 미비와 낮은 신뢰도를 가진 기관으로 인해 어려움을 토로했다. 이러한 기술 격차를 해소하기 위해 필수 인프라와 자원을 제공하는 노력이 필요하며, 이는 교육 기회의 평등을 실현하는 데 있어 핵심적인 요소가 될 것이다. 더불어, 언어교육에서의 생성형 인공지능의 도입은 다양한 학습 요구를 충족시키면서도 학습자 개별 학습을 하기 위해서는 교수자들이 생성형 인공지능은 물론 온라인 도구를 효과적으로 통합할 수 있는 훈련과 지원이 제공되어야 한다. 강남욱(2024)에서도 ChatGPT를 비롯한 디지털 도구의 훈련은 한국어 교실 밖에서 우리가 아는 것 이상으로 활발하고 적극적으로 교수-학습하고 있는 중이나 한국어 교실에서는 아직도 디지털 격차가 상당히 큰 편이라고 지적하였다. 김정훈(2024)에서도 전통적 교실에서 제한적이거나 불가능했던 교수 방법을 디지털 도구를 사용하여 구현하기 위해서는 필수적으로 디지털 역량과 강력한 리더십 역량의 필요성을 강조하였다. 디지털 도구를 사용한 언어교육을 위해서는 교육 내용이나 교수 방법의 변화만 아니라 다양한 디지털 인프라 구축과 디지털 도구를 활용하여 교사의 역량 강화를 위해 교사들의 보수 교육이 시행되어야 하며 이를 위해서는 많은 재원과 지원이 필요하다. 이를 교사나 교육 기관만으로는 힘이 들며 보다 정부 부처나 국가 차원의 지원이 있어야 할 것이다.
5. 결론
2022년 11월에 ChatGPT가 등장하면서 사회 분야는 물론 교육 분야에서 큰 혼란을 겪었다. 인간과 가장 유사한 형태로 글을 만들어 내는 기술은 학습자들이 이전과는 다른 형태로 표절을 하거나 부정행위를 할 수 있다는 우려가 지배적이었다. 그래서 ChatGPT 등장 이후 많은 교육 기관에서 사용 금지를 했고, 부정적인 도구로 인식했다. 그러나 시간이 지나면서 교수자들은 ChatGPT를 부정적인 도구로 보기에는 교육적으로 활용할 수도 있겠다라는 생각이 싹 트면서 현재는 교육을 개선할 수 있는 긍정적인 도구로 바라보고 있다.
ChatGPT로 대표되는 생성형 인공지능이 교육에 미치는 긍정적인 영향으로 꼽는 것이 우선 학생 개개인의 학습 수준과 학습 양식을 고려하여 맞춤형 학습 자료를 제공하여 맞춤형 학습이 가능하고, 학습자와 생성형 인공지능 간의 대화를 통하여 학습에 대한 흥미를 유발할 수 있어 상호작용적인 학습이 가능하다. 학습자뿐만 아니라 교수자들은 여러 교육 행정 업무나 학습 자료를 만들거나 평가에 이용하여 교수자의 업무를 줄일 수도 있다. 이런 교육에 미치는 긍정적인 영향은 언어교육에서도 활용할 수 있다. 의사소통 중심교육이 지배적인 외국어 교육 분야에서 학습자 수준에 따른 개별 학습 과제를 생성하고, 학습 자료를 제공할 수 있다.
하지만 이런 생성형 인공지능이 언어교육에 혁신적인 변화를 가져올 수 있는 잠재력을 가지고 있지만 교수-학습 상황에서 활용 시 우려와 함께 해결할 과제도 있다. 먼저 학습자들이 생성형 인공지능을 이용한 과제를 무분별하게 표절할 수도 있고, 생성형 인공지능이 만들어 낸 정보의 정확성 문제도 있다. 이런 문제를 해결하기 위하여 교수자들은 기존의 전통적인 평가 방법을 변경해야 한다. 또한 누구나 생성형 인공지능 사용에 차이를 두어서 안 된다. 끝으로 생성형 인공지능 사용에 대한 윤리적 문제에 대한 교육도 필요하다. 즉 생성형 인공지능을 언어교육에서 효과적으로 활용하기 위해서는 윤리적 문제, 기술적 한계, 교육적 격차 등의 도전 과제를 해결해야 한다. 이런 과제 해결을 통하여 미래 언어교육의 발전 방향을 모색하고, 교육 현장에서 생성형 인공지능을 보다 효과적으로 활용할 수 있는 연구가 계속해서 이뤄져야 할 것이다.
References
Notes
BoW 기법 대신 TF-IDF 형식으로 분석하면 토픽의 빈도와 희귀성(IDF) 함께 고려하여 특이하고 구체적인 단어가 각각의 토픽에 등장해서 각 토픽간의 차별화는 뚜렷해지나 단어들의 집합인 토픽명을 명명하기 어려운 점이 있다.
이는 ChatGPT를 비롯한 생성형 인공지능 사용의 연령 제한과 연관이 있으며, 초등교육에서는 주로 생성형 인공지능을 활용한 스토리북 제작, 수업 설계, 수업 활용 등 교사가 활용할 수 있는 방안 연구가 주를 이루었다.
Donahoe는 학생들에게 글을 쓰고 로봇처럼 행동하라고 요구하는 것보다 AI와 상호작용하며 그것이 생성한 내용을 비판적으로 생각하는 것이 교육을 더 인간적으로 느끼게 할 수 있다라고도 하며. ChatGPT의 활용을 긍정적으로 봤다. https://www.technologyreview.com/2023/04/06/1071059/