Korean J General Edu Search

CLOSE


Korean J General Edu > Volume 18(5); 2024 > Article
대학 글쓰기 수업에서 학생 인식 기반 AI 피드백의 효용성 연구

Abstract

본 연구에서는 대학 글쓰기 교양수업에서 AI 자동 평가 피드백 도구의 교육적인 효용성을 살펴보았다. 대학 교양교육에서 AI 활용에 대한 논의가 활발한 가운데 AI 자동 평가 도구를 실제 글쓰기 수업에 적용하여 그 결과를 분석하였다. 연구 결과 AI 피드백이 학습자의 글쓰기 동기 부여에 긍정적 영향을 미치며, 맞춤법, 어휘, 문법, 표현 수정 등의 정확성에서 만족도가 높게 나타났다. AI 자동 평가 피드백은 교수자의 피드백 부담을 줄이고 학습자에게 유의미한 피드백을 제공하도록 도와준다. AI 글쓰기 자동 평가 피드백 도구가 AI 리터러시 함양에 기여할 것으로 기대한다. 이 사례 연구가 대학 글쓰기 수업에 AI 자동 평가 피드백이 효과적으로 도입되기 위한 시사점을 제공했다는 점에서 의의가 있다.

Abstract

This study examined the educational effectiveness of AI-based automated evaluation feedback tools in college writing courses. Amid active discussions on the use of AI in liberal arts education, the study applied AI automated evaluation tools to actual writing classes and analyzed the results. The findings show that AI feedback positively influenced students’ motivation for writing and achieved a high level of satisfaction in areas such as spelling, vocabulary, grammar, and expression correction accuracy. AI automated evaluation feedback helps reduce the feedback burden on instructors and assists them in providing meaningful feedback to students. It is expected that AI-based automated writing feedback tools will contribute to fostering AI literacy. This case study is significant in that it offers insights for effectively incorporating AI automated evaluation feedback into college writing courses.

1. 서론

이 연구는 대학 글쓰기 교양수업에서 AI 자동 평가 피드백 도구가 학습자 인식 조사를 기반으로 하여 글쓰기 교수학습에 미치는 교육적 효과를 살펴보는 데에 그 목적이 있다. AI 시대에 생성형 AI의 등장으로 대학 교양교육에서는 AI를 어떻게 활용해야 할지 논의가 활발히 이루어지고 있다. 대학생들은 과제를 위해서 챗GPT와 같은 생성형 AI 도구를 적극적으로 활용하고 있으며, 이에 대응하기 위해 여러 대학에서는 생성형 AI의 활용 지침을 발표하였다. 대학 수업에서 AI를 도입하고 활용하는 것을 두고 긍정적 또는 부정적 견해가 오가고 있다. 그렇지만 기존 교육을 바꾸게 하는 AI 도구의 장단점을 따지기에 앞서, AI의 적절한 활용을 교육의 장으로 끌어와 학생들의 사고력과 창의력을 높이고 미래사회에 대비하기 위한 교육적 실천 방안을 마련하는 것이 바람직하다(이빛나, 2023). 대학 교양교육 수업에서는 AI를 효과적으로 활용하여 학생이 스스로 새로운 단어나 아이디어를 찾음으로써 글쓰기 기술을 향상하도록 구성해야 한다(Hanane, 2023). 이러한 맥락에서 대학의 교양교육에서는 AI 리터러시를 함양하는 방향으로 교육의 변화가 이루어져야 하는 것이다.
글쓰기 교과목은 교수자가 여러 학생의 다양한 글쓰기를 피드백해야 하므로 교양수업에서도 교수자의 부담이 상당히 큰 편이다. 그렇기에 교수자는 학습자의 요구사항을 반영하여 글쓰기의 과정마다 피드백을 해야 하는 업무 과중으로 실질적인 맞춤형 피드백이 이루어지기보다는 포괄적이고 인상적인 피드백에 그치는 것이 교육 현장의 실태이다. 이러한 업무 부담으로 인해 교양교육에서 글쓰기 교과목이 교수자마다 글쓰기의 과정에서 각기 다른 피드백을 제공하는 등 수업이 효율적으로 운영되기 힘들다는 단점이 있다. 더욱이 한 교수자가 여러 분반을 담당하는 경우에는 피드백의 일관성이나 체계성 등을 담보하지 못한다는 어려움마저 존재한다. 이처럼 대학 글쓰기 교양수업에서는 글쓰기 피드백 및 평가 방법론의 다변화가 필요한 시점이다.
특히 AI가 교육 전반에 영향력을 미치고 있기에 대학 교양수업의 글쓰기 수업에서도 AI를 활용한 글쓰기가 요구되며 학생들에게 AI 리터러시 역량을 키우도록 구성되어야 한다. AI 글쓰기 평가 피드백 도구를 수업에 활용하기 위해서 대학생의 인식 조사를 바탕으로 실제 글쓰기 역량에 도움이 되었는지를 살펴볼 필요가 있다. 이러한 학생 인식 조사를 바탕으로 AI 글쓰기 자동 평가 피드백 도구가 대학 글쓰기 교양교육 수업에 반영되기 위한 방향성을 제시한다는 점에서도 본 연구의 필요성이 있다.
따라서 이 연구에서는 AI 자동 평가 도구를 대학 글쓰기 수업에 적용해 봄으로써 AI 글쓰기 피드백의 효용성을 탐색하고 AI 자동 평가 피드백을 교양교육에 적용하기 위한 교육적 효과를 밝히고자 한다. 이를 해결하기 위하여 다음과 같은 연구 문제를 제시하였다.
첫째, AI 글쓰기 자동 평가 피드백에 대하여 대학생들은 어떻게 이를 인식하고 있는가?
둘째, AI 글쓰기 자동 평가 피드백이 학생들의 글쓰기 능력 향상에 미치는 영향은 무엇인가?
셋째, AI 글쓰기 자동 평가 도구를 대학 글쓰기 교양교육의 수업에 어떻게 반영할 수 있을 것인가?
이러한 문제에 대한 해결을 목적으로 실제 글쓰기 교양교육 수업에서 ‘논리적 글쓰기’ 과제 수행 시, AI 자동 평가 피드백을 활용한 수업을 진행하고 학습자의 인식 조사를 통해 첫 번째와 두 번째 연구 문제를 논의하고, 연구 결과를 분석함으로써 지금까지 적용된 AI 글쓰기 자동 평가 피드백 도구의 효용성과 개선점에 대하여 제언하고자 한다. 이 연구는 단순히 AI 자동 평가 피드백이라는 도구가 대학 글쓰기 교육의 질적 향상 및 학습자 중심 교육 환경에 기여할 수 있으며, 급변하는 교육 환경에서 대학 교양 글쓰기 교육의 역할과 방향성에 고려 사항을 파악함으로써, AI 도구 활용의 교육적 효과에 중요한 기초 자료로 활용될 것으로 기대한다.

2. 연구 배경

2.1. AI 자동 평가 연구 동향

대학 글쓰기는 학습 결과를 평가하고 학생들의 학습 과정을 안내하며 학습자의 문해력을 측정하는 데에 핵심적이고도 유용한 분야로 평가받고 있다. 대학에서 글쓰기 교과는 대체로 필수로 이수해야 하는 과목으로 한 교수자가 많은 학생을 담당해야 하므로 교수자에게 글쓰기 피드백은 큰 부담이 아닐 수 없다. 따라서 대규모 글쓰기 평가를 위하여 자동 평가의 시스템 등이 요구되며, 최근에는 AI를 기반으로 한 글쓰기 자동 평가 시스템이 마련되기도 하였다. 본 연구에서는 AI 기반 글쓰기 자동 평가의 연구 동향을 살펴봄으로써 대학 글쓰기 평가 도구로 AI 피드백 도구의 활용 가능성을 탐색하고자 한다.

2.1.1. 자동 에세이 평가 시스템

자동 에세이 평가 시스템(AEE, Automated essay evaluation systems)은 1966년 미국 고등학교 영어 교사 페이지(E.Page)가 ‘Essay Grade’라는 학생 에세이 채점을 위한 프로젝트로 시작되었고, 수작업 채점 시간을 줄이는 해결 방법으로 이루어졌다. 당시 에세이 등급을 예측하는 데는 인상적인 성공을 거두지만 작문, 교육에 제한적으로 수용되었고 도구나 기술에 대한 품질이 좋지 않았다. 이어 인터넷, 워드 프로세스, 소프트웨어, 자연어처리가 활용되면서 AEE 시스템 개발이 가속화되었다.
주로 미국 영어 글쓰기 평가를 위하여 자동 에세이 평가 시스템이 발전해 왔다. 자동 에세이 채점(AES), 자동 에세이 채점(AEG), 자동 작문 평가, 자동 에세이 평가(AEE) 등의 용어 등으로 사용되었으며 자동화된 프로세스를 통하여 학습자가 자신의 글에 대하여 건설적으로 피드백을 받을 수 있다는 점에서 유용하며 이로써 자동 에세이 평가는 교육 환경에서 확고한 지원 기술로 자리잡아 왔다. 현재 자동 에세이 평가 시스템(AEE)은 졸업 기록 시험(GRE), 외국어로서의 영어 시험(TOEFL), 대학원 경영 입학 시험(GMAT), 미국 대학 평가 시험(SAT), 미국 대학 입학 시험(ACT), 영어 국제 커뮤니케이션(TOEIC), 분석적 작문 평가(AWA), 아동 낙오 방지법(NCLB) 및 피어슨 영어 시험(PTE) 등 다양한 고난도 평가에서 인간 채점자와 함께 활용되고 있다. 일례로, 피어슨 쓰기 자동 채점에서는 아이디어, 구성, 표기, 문장, 단어, 문체 등의 항목에서 1에서 6점까지 측정하고 있으며 단어 수와 글의 길이에 대해서 평가한다. 기존 AEE 시스템의 가장 큰 약점은 텍스트 의미를 매우 모호하게 이해하며 주로 구문에 초점을 맞춘다는 점이다. 대부분의 자동 평가 시스템은 구문을 분석하거나 텍스트 간의 유사도 계산하여 의미론적 해석을 간과하는 데에 그 문제가 있다.
글을 자동 평가하기 위한 최신 기술로 내용을 분석하려는 시도도 있다. 글의 의미 해석을 위한 기술로 잠재 의미 분석(LSA), 잠재적 디리클레 할당(LDA), 콘텐츠 벡터 분석(CVA) 등을 사용된다. 텍스트 문서의 창의성을 평가하는 모델로는 GAN 모델, CNN 모델, TM(Tsetlin machine) 강화 학습 모델, 가우스 프로세스 선호 학습(Gaussian Process Preference Learning) 등이 활용된다(유대곤⋅온병원, 2022). 이뿐만 아니라 한국어 데이터를 활용하여 세부 항목별 점수를 확인하기 위한 AES(Automated Essay Scoring) 모델이 있는데, 이는 심층 신경망 기반의 자질을 사용하여 에세이 논증 구조 정보를 모델이 학습하고 평가 항목별 레이어를 구분하여 항목별 벡터 표현을 학습하도록 개발되었다(이예진⋅김학수, 2023). 에세이 자동 평가는 주로 영어 데이터를 중심으로 이루어졌으며, 한국어 데이터를 기반으로 자동 평가 피드백 도구는 아직 많이 마련되지 않았다.

2.1.2. AI 글쓰기 자동 평가의 필요성

글쓰기 평가는 공통적으로 ‘① 텍스트 이해 → ② 텍스트 평가 → ③ 평가 결과 정교화’의 단계로 구성된다. 글쓰기 평가자는 이러한 절차로 최종 점수를 결정하며 이 과정은 선조적(linear)이 아니라 반복적(iterative, recursive)인 성격을 지니는데, 이 과정에서 평가자는 인지 부하를 느끼기도 한다(김승주, 2021). 이를 해결하기 위해서 AI 자동 채점 시스템이 대학 글쓰기 및 교양교육 과정에 도입된다면 교육의 질을 개선할 수 있을 뿐만 아니라 교수자의 부담을 줄일 수 있으며, 아울러 학습자들에게 즉각적인 피드백을 제공하는 등 다양한 효과를 가져올 수 있다. 이와 같은 맥락에서 AI 글쓰기 자동 평가 시스템이 교양교육 과정에 미치는 영향을 탐구하는 것은 교육 기술의 발전이 교육 방식에 어떻게 반영되어야 하는지에 대한 중요한 통찰력을 제시하므로 더욱이 중요하다.
국내에서는 2019~2022년 ‘세종한국어평가(SKA) 개발’을 위한 쓰기 영역 평가 틀로 AI 활용 자동 평가 방식을 도입하려는 시도가 이루어졌다(이용상 외, 2022). ‘한국교육과정평가원’에서는 대규모 평가에서 서답형 문항의 효율적인 채점 방안을 마련하기 위하여 한 문장으로 이루어진 단문 답안의 자동 채점 프로그램을 개발한 시도가 있었다(노은희 외, 2016). 2023년 ‘국립국어원’에서도 ‘국민의 글쓰기 능력 진단 체계 개발’을 위하여 글쓰기 평가 지표를 마련하고 논증적 글쓰기 평가 설명서 및 평가 전문 인력 양성 프로그램 등을 마련하였다. 또한 국립국어원은 국민의 글쓰기 능력을 향상하기 위하여 AI 글쓰기 채점 시스템을 구축하고 체계적인 글쓰기 교육을 강화할 전망이다(박종임 외, 2023). 이처럼 다양한 기관에서 글쓰기 평가를 위한 기준, 지표에 관한 연구가 마련되고 AI를 활용한 자동 평가 시스템의 도입 등에 관한 연구가 활발히 진행되고 있다.1) 대학에서 AI 글쓰기 피드백을 활용한 사례 연구로 백혜선(2024)이 있으며, 챗GPT를 활용하여 글쓰기 의사소통 역량 평가도구 개발을 위한 연구(박소영 외, 2024)가 있다. 앞으로는 국가 주도로 한국어의 글쓰기 능력을 채점하는 프로그램이 마련될 전망이다.2)
기존 연구에서는 글쓰기 자동 평가 프로그램의 한계를 지적하였다. 자동 평가 모델이 학습자 글에서 표현 층위의 문제는 잘 짚어내는 데에 비해 학습자의 글로부터 논증이나 논거 등과 같은 소위 말하는 고차원의 언어 사용 능력과 관련한 기준을 채점하는 데에는 어려움을 나타낸다는 것이다(Chen & Cheng, 2008; Link, 2022). 이는 장르에 적절한 표현 방식인지, 문법적으로 잘못된 부분은 아닌지와 같은 표현 측면의 채점 결과를 예측하는 것은 표면적으로 ‘드러난’ 부분에서는 그 규칙성을 찾을 수 있지만, 상대적으로 내용적 측면은 더욱 복잡한 추론 과정을 요하기 때문에 그 규칙성을 찾기 어렵다는 사실을 말해준다. 결과적으로 이러한 현상은 현재의 기술 수준의 한계를 고려할 때, 자동 평가 피드백 모델이 충분한 수준의 일반화를 달성하지 못한 것으로 해석된다(김승주, 2021). 2010년까지는 주로 단답형 답안에 나타나는 키워드를 중심으로 이진분류 방식으로 자동채점이 이루어진 데에 비해 최근 에세이 수준의 다문장을 자동 채점하려는 시도가 이루어지고 있지만(박종임 외, 2023), 여전히 한국어 글쓰기 자동 채점은 영어에 비해 데이터와 기술 모두 시작 단계에 놓여있다고 하겠다.
그럼에도 불구하고 AI 자동 평가는 글쓰기 교육 환경에 도입될 필요가 있다. 교수자와 학습자들은 자동 평가 프로그램이 제공하는 피드백을 선택적으로 교육 맥락에 활용하거나(Grimes & Warschauer, 2010), 기계에 의한 평가 기능이 완벽하지 않다는 것을 전제하고 기계로부터 높은 점수를 받을 수 있는 글을 써보도록 지도하기도 한다. 또는 교수자가 자신의 채점 과정에 자동 평가 프로그램을 활용할 때에는 글의 표현 차원을 채점하는 데에만 유용하게 사용하고, 글의 내용과 관련된 부분은 직접 채점하기도 한다(Chen & Cheng, 2008; Li, Link & Hegelheimer, 2015; 김승주 2021, 재인용). 글쓰기 자동 채점을 위해서 글의 전개 구조, 내용 및 과제 수행, 언어 사용, 작문 길이 등의 채점 자질을 추출하고 이러한 자질이 글쓰기 자동 평가에 타당함을 검증한 연구도 진행되었다(이진 외, 2023; 차준우 외, 2024). 이처럼 한국어 기반의 AI 자동 평가는 앞으로 글쓰기 교육 환경에 적용될 전망이며, 국민의 글쓰기 능력 평가 및 한국어능력시험(TOPIK)에서도 AI 글쓰기 자동 평가가 활용될 것이다. 이와 같은 흐름은 대학 글쓰기 교양수업에서도 AI 글쓰기 자동 평가 피드백을 활용한 교수학습이 개발되고 적용되어야 할 시점에 이르렀음을 방증한다.

2.2. AI 시대 교양교육에서 글쓰기의 중요성

최근 대학 교육은 기술 발전, 경제 변화, 사회적 요구 등 다양한 요인에 의해 지속적으로 변화하고 있다. 특히 AI 기술의 발전은 교양교육에 새로운 도전을 요구하기도 하고 새로운 기회를 제공하기도 한다. AI 시대의 교양교육은 포스트휴먼 시대에 새로운 세계관이 자라나는 성장 세대의 인식과 가치관에 부합하도록 교양 기초교육의 방향이 재설정될 필요성이 있다(손승남, 2020).
교양교육의 대외적 위기는 전통적 교육모델의 고수로 인한 혁신 부족, 기술적 발전의 충분한 활용 부족, 변화하는 사회적 요구에 대응 미비 등으로 나타난다. 이에 대응하기 위해서는 AI 시대에 맞는 교양교육의 혁신, AI 리터러시와 다양성 존중, 융복합 협력 구축, 학생 피드백을 반영한 지속적인 교육 프로그램 평가와 개선 등의 대책을 마련해야 한다.
교양교육을 학생들의 요구를 반영하여 개선 및 발전되어야 한다. 교양교육에 대한 학생들의 요구는 ‘사회변화를 반영한 교육내용’, ‘문제의 해결과정 학습’, ‘학습자 수준을 고려한 교육’으로 나타났다(안미영, 2023). 이는 학습자 스스로가 새로운 AI 기술의 변화에 적응하며 이를 활용하여 사회 문제에 대한 해결 능력을 갖추도록 교양교육이 이루어져야 함을 뜻한다. 따라서 AI 기술을 활용하여 생각을 확장하고 문제 해결력을 기르는 역량이야말로 더욱 더 중요해진다. 그렇기에 대학의 글쓰기 교양교육도 학습자가 AI 기술을 자신의 글에 적용해 보고, 비판적으로 검증해 보는 방식으로 바뀌어야 한다. 이뿐만 아니라 AI와 협업하여 자신의 글을 수정하면서 AI를 올바르게 활용할 수 있는 AI 리터러시를 함양하도록 해야 한다.
앞으로 학령인구가 줄어들며 문해력의 저하가 심각해지는 시점에서 대학의 글쓰기 교육은 새로운 방향을 제시하지 않으면 안 된다. AI 디지털 시대를 살아가는 학습자에게 실용적이면서도 미래지향적인 교육을 하기 위해서라도 교양교육은 AI를 활용하여 AI 리터러시를 함양하도록 변화할 수밖에 없는 것이다. 특히, 박남기(2023)에서도 ‘스말로그(smart+analogue)’ 교육을 제안하면서 생성형 AI와 협업하는 글쓰기로 교양교육의 패러다임이 변화해야 한다고 논의하였다.
이처럼 대학의 글쓰기 교양교육에서는 시대 변화와 함께 학습자의 요구를 반영한 교수법이 다양하게 개발되어야 한다. 이 연구에서는 AI 도구를 활용한 평가 피드백이 학습자에게 교육적 효과를 거둘 수 있는지를 학생 인식 조사를 토대로 살펴보고, 나아가 AI 평가 피드백 도구를 반영한 교수-학습 방안을 개발하는 데에 고려할 사항들을 논의하고자 한다. 이 연구는 미래 사회를 대비하기 위하여 대학의 글쓰기 교양교육의 변화를 도모하기 위하여 AI 자동 평가 피드백 도구를 활용한 대학 글쓰기 수업 사례 분석할 것이다. 이 연구를 통해 기술적 발전과 대학 글쓰기 교양교육의 사회적 요구에 대응하는 방안을 모색하고, 나아가 이 교육적 경험을 통해서 AI 글쓰기를 위한 통찰력을 제공할 수 있을 것이다.

3. 연구 방법

3.1. 연구 대상

이 논의에서 연구 대상은 <표 1>과 같이, 연구자가 가르치고 있는 S대학교 교양교육 교과목 ‘독서와 표현’, ‘사고와 글쓰기’, ‘대학 글쓰기’ 수업을 듣는 수강생 115명을 대상으로 하였다. ‘독서와 표현’은 교양 기초 공통 교과목으로 교양 필수 과목이고, ‘사고와 글쓰기’는 교양 선택 과목으로 1학년을 대상으로 한다. ‘대학 글쓰기’는 심화교양 수업으로 1~4학년까지 다양하게 분포해 있다. 연구 대상을 특정 전공과 학년으로 제한하지 않은 이유는 앞으로의 교양교육은 다양한 전공과 학년을 망라하여 핵심역량을 갖추는 방향으로 나아가야 하기에 선택적 집단에서 나타나는 결과 분석보다는 포괄적으로 학생들의 인식을 반영하고자 했기 때문이다. 이 교과목을 수강하는 학생들은 다양한 전공으로 이루어져 있으며, 수강생은 강의계획서에 따라 한 편의 ‘논리적 글쓰기’를 제출해야 한다. ‘논리적 글쓰기’에서 ‘논증’이란 ‘논거’를 바탕으로 자신이 설정한 ‘주제’를 전개하는 것이다. ‘논리적 글쓰기’ 역량은 대학에서 신입생이 학문적 공동체로 입문하기 위하여 필수적으로 갖추어야 하며, 사회의 다양한 현상을 이해하고 분석하며 해석하는 과정으로써 주제를 탐구하는 과정을 거친다는 점에서 중요하다. 이뿐만 아니라 논리적 글쓰기의 과정은 사고의 표현이나 글쓰기의 도구적 속성의 특성을 지닌다(김규훈, 2024).
<표 1>
글쓰기 교양 교과목에 따른 연구 대상 범위
교양 교과목 수강생 대상 학년 핵심역량 글쓰기 과제
독서와 표현 35 1학년 자기주도, 융복합, 소통, 도전, 문제해결 논리적 글쓰기

사고와 글쓰기 69 1학년

대학 글쓰기 11 전학년
이 연구에서는 경험적 글쓰기, 정보전달 글쓰기, 창의적 글쓰기와 같은 여러 가지 글쓰기 중에서도 ‘논리적 글쓰기’가 과정별 글쓰기를 이해하고 핵심역량을 신장하기에 제일 적절하다고 보았다. 더욱이 AI 글쓰기 자동 피드백 도구를 활용하기 위해서도 기존 교양교육 과정에서 제시하는 글쓰기 교과목의 핵심역량을 반영해서 구성할 필요가 있다. 이는 AI 글쓰기 평가 피드백 도구가 얼마만큼 핵심역량을 증진하는 데에 도움이 될지 관련된 연구에 이 연구 결과를 지속적으로 반영하기 위함이다. 학습자가 ‘논리적 글쓰기’의 과제를 수행하는 데에 있어서 AI 글쓰기 평가 피드백을 통해서 핵심역량을 키울 수 있도록 수업 내용을 구성한다.
이 연구를 진행한 S대학교 교양교육 교과목은 5개의 핵심역량인 ‘자기주도, 융복합, 소통, 도전, 문제해결’을 증진하도록 설계되어 있다. 구체적으로는 ‘자기주도’ 역량으로, 자기 생각을 AI 피드백을 통해 자기주도적으로 수정하고, 자신의 글을 스스로 평가해 볼 수 있다. ‘융복합’ 역량으로는 다양한 텍스트를 융복합적으로 활용할 수 있는 역량으로 AI 자동 평가 프로그램에서 구현하고 있는 오류 분석 결과를 스스로 이해하여 자신의 글에 융복합적으로 반영할 수 있다. ‘문제해결’ 역량은 자신이 완수해야 할 논리적 글쓰기의 과업을 효과적으로 달성할 수 있도록 문제해결 역량을 함양하는 것을 말하는데, AI 도구를 활용하여 고쳐쓰기의 과정을 이해할 수 있다. 수업에 AI 자동 평가 도구를 활용하면 ‘자기주도, 융복합, 문제해결’의 역량이 더욱 강화될 것으로 기대한다.
학습자는 수업 과제로 한 편의 논리적 글쓰기를 제출해야 한다. 수업에서는 3차시에 걸쳐 논리적 글쓰기의 과정을 이론적으로 배우고 1차시를 실습으로 구성하여 학습자 스스로가 AI 자동 평가 프로그램을 활용하여 피드백 결과를 반영한 글을 제출하도록 하였다. 과제 평가 점수와 별도로 AI 글쓰기 활동 점수를 부여하여 AI 자동 평가 피드백 도구를 활용하여 자신의 글을 점검해 보고 수정하는 과정을 반영하고자 하였다. AI 자동 평가 점수는 평가에 반영하지 아니하고 학생 스스로가 AI 피드백 결과를 검토하여 글의 완성도를 높이도록 했다. 이러한 활동이 학습자에게 글쓰기에 대한 동기를 부여하고 AI 활용 역량을 함양하는 데에 도움이 될 것으로 판단했다.

3.2. 연구 절차

연구 대상이 되는 S대학교 교양교육원에서는 2024학년도 1학기부터 AI 글쓰기 피드백 도구를 교과목에서 활용할 수 있도록 ‘투블럭 에이아이’에서 운용하고 있는 ‘키위(Keewi, Korean Essay Evaluation with AI)’를 선정하였다.3) 물론 챗GPT와 같은 대규모의 생성형 AI를 활용할 수도 있다. 챗GTP는 명령어(prompt)를 입력하면서 글을 생성하고 작성한 글을 검토하는 데에 초점이 맞추어진 데에 비해, ‘키위’ 프로그램은 글 통계 자료를 제시하며, 6가지 평가 기준에 따라 장르에 맞도록 글을 평가한다. 평가뿐만 아니라 학생이 쓴 글에 대해 문단별 피드백 정보를 제시하고 있어 체계적인 피드백을 받을 수 있다는 장점이 있다. ‘키위’는 좋은 글로 판단되는 학습 데이터를 기반으로 개발된 AI 글쓰기 평가 피드백 기술로 표준화된 평가 기준과 글 데이터를 채점한 결과 정규 분포를 따르는 것이 확인되었다. 최근 에듀테크 서비스를 제공하는 다양한 기업이 생겨나고 있지만 ‘키위’는 AI 글쓰기 자동 평가와 피드백에 특화된 도구이자 평가 기준이 제공되어 추후 평가 결과를 논의하는 데에도 적절할 것이라 판단하여 ‘키위’ 도구를 선정하였다. 나아가 ‘키위런(학습자용)’과 ‘키위티(교수자용)’으로 구분되어 교수자가 학습자의 글쓰기 평가 피드백 결과를 확인할 수 있다는 점에서도 효과적이다. 교수자가 학습자의 명령어를 일일이 확인하기 어려운 챗GPT보다 ‘키위’ 도구를 통해서는 교수자가 학습자의 글쓰기 피드백 내용을 일괄적으로 파악하기 용이하다는 장점이 있다. 실제 AI 도구를 선정하기 위하여 교양 수업에서 마련한 AI 글쓰기 수업 절차는 [그림 1]과 같다.
[그림 1]
AI 글쓰기 수업 연구 절차
kjge-2024-18-5-159-gf1.jpg
연구 절차는 다음의 5단계로 진행되었다. [그림 1]에서 보듯이, 1단계로는 대학 교양수업에서 활용할 수 있는 AI 글쓰기 자동 평가 프로그램인 ‘키위티’와 ‘키위런’의 사용법을 학기가 시작하기 전에 교강사 워크숍을 통해서 교수자 교육을 진행했다. S대학의 교양교육원에서는 다분반 수업의 표준화를 마련하고 균질한 수업 운영이 되도록 학기의 시작과 마무리에 교강사 워크숍을 진행하고 있다. 2단계로는 강의계획서에 AI 글쓰기 피드백과 관련된 내용을 제시하고 수업 오리엔테이션 때에 학생들에게 이와 관련된 내용을 명시적으로 공지하였다. 미리 회원 가입을 하고 교수자 인증이 필요한 부분이므로 사전 안내가 필요하다고 판단하였다. 교수자는 다분반 수업에서 클래스를 구분하여 교수자 인증을 요청한 수강생을 배치하는 작업을 진행하고 AI 자동 평가를 적용할 글쓰기 과제를 부여한다. 필자는 각기 다른 교과목이라 하더라도 글의 종류를 ‘논리적 글쓰기’로 동일하게 적용하여 대학 교양수업에서 필요한 비판적 사고와 논증에 대한 글을 쓰도록 과제를 정하였다. 3단계에서는 학생들에게 논리적 사고와 글쓰기 이론 수업을 진행하였다. 글쓰기의 과정에 따라 계획하기, 집필하기, 수정하기의 단계를 설명하고, 논리적 글의 구조와 예시를 통해 경험적 글쓰기와 무엇이 다른지 교수-학습하였다. 논리적인 단락 쓰기를 위하여 소주제문과 보충문의 구조를 연습하고 주제를 정하도록 하였다. 4단계로 AI 자동 평가 프로그램을 한 단락 쓰기 및 초고 쓰기 피드백으로 활용하였다. 컴퓨터 실습실에서 ‘키위런’을 활용하여 자신이 작성한 논리적 글쓰기의 초고에 대해 AI 피드백을 받도록 하였다. 흥미롭게도 교실에서 글쓰기 과정을 조별로 피드백할 때에는 소극적으로 참여하던 학생들도 AI 피드백을 실시할 때에는 능동적으로 참여하고 있음을 관찰할 수 있었다. 학생 대부분은 낙오되지 아니하고 AI 글쓰기 피드백 실습에 적극적으로 임하였다. 처음에는 AI로부터 자신이 쓴 글을 평가받는다는 점에 낯설어하기도 하였지만 AI가 잡아낸 오류를 보고 작성한 글을 이내 수정하는 등 마치 게임에서 점수를 올리듯이 문법, 어휘, 맞춤법 등의 오류를 수정해 나갔다. 적게는 2~3회, 많게는 50회 이상 AI 피드백 사항을 수정하면서 자신의 글을 다듬어 가는 과정을 관찰할 수 있었다.
[그림 2]는 AI 자동 평가 도구인 ‘키위런’을 활용한 학습자의 논리적 글쓰기 피드백 결과다. 좌측은 학생의 글에 대한 내용 분석이 이루어지며, 우측은 글자 수, 문단 수, 문장 수, 긴 문장, 예상 독자 나이, 읽기 쉬운 정도와 같은 글 통계 자료가 제시된다. 우측 하단에는 6가지 지표인 ‘문법, 어휘, 표현, 문장, 조직, 주제’에 근거하여 평가를 보이고 있다. 평가 기준에 따라 아래에 문단별로 피드백을 제시하고, 현재 점수를 제공한다. 키위런에서는 좋은 글의 6가지 특성을 기준으로 제공하고 있는데 이는 수만 개의 글 데이터를 채점하여 정규 분포를 보여 타당도가 높고 신뢰도 높은 객관적 평가라고 할 수 있다. 그렇지만 이 6가지의 기준이 대학생의 ‘논리적 글’을 평가하기 적합한 것인지는 좀 더 검증이 필요하다. 왜냐하면 대주제 및 문단 내에서 소주제의 긴밀성이나 맥락에 적절한 의미적 구성 등에 대해서는 AI 평가가 충분하게 이루어지지 못한다는 아쉬움이 있기 때문이다. 이와 같이 대학 글쓰기의 평가 기준에 대하여 구자황(2020)에서는 전국 수준에서 대학 글쓰기 평가 항목과 기준을 마련해야 하며, 대학 글쓰기 교육 목표와 대학 글쓰기 평가의 유기적 선순환 구조의 설계가 필요하다고 논의하였다.
[그림 2]
한 단락 쓰기 AI 자동 채점 피드백 예시
kjge-2024-18-5-159-gf2.jpg
‘키위’의 내용 분석으로는 글에서 개선할 부분에 대하여 도움말을 제공하며 잘된 부분에 대해서도 피드백을 제시한다. 이는 학습자에게 스스로 자신의 글의 긍정적, 부정적 부분을 파악할 수 있도록 하여, ‘자기주도적’으로 부족한 부분의 글쓰기의 ‘문제 해결’을 하도록 하는 기능을 한다. 실제로 학생의 예시를 살펴보니 ‘중심 내용과 어울리는 단어 비율이 비교적 높다(75.6%)’라고 정량적으로 제시하며, ‘주장하는 글로, 글의 장르에 알맞게 구성하여 작성했다’라고 정성적으로 평가한다. 아직 완성된 글이 아니므로 ‘조직’에는 다소 낮게 평가되었다. 교수자는 학생들이 제출한 결과를 ‘키위티’의 과제 관리에서 확인할 수 있고 수정 횟수를 확인할 수 있다. 교수자가 학생마다 글쓰기의 과정을 확인할 수 있다는 점에서 AI 글쓰기 평가 도구는 편리하며, 학습자도 AI 피드백을 토대로 자신의 글을 수정하면서 완성도를 높일 수 있다는 측면도 긍정적으로 작용한다.

4. 연구 결과

이 장에서는 앞서 제시한 연구 문제와 관련하여 연구 결과를 학습자 인식과 태도, AI 자동 평가 피드백 도구와 피드백의 효과성, 교양교육에서의 교육적 효용성 측면에서 연구 결과를 분석해 보고자 한다. 학생들을 위한 설문조사는 ‘네이버폼’을 활용하여 AI 자동 평가 피드백 실습 후에 개별로 자율적으로 실시하도록 하였다. 총 115명 가운데 85명의 응답이 이루어졌으므로 이를 토대로 하여 설문조사 결과를 분석하고자 한다.
설문 문항은 객관식과 서술형 문항으로 이루어졌고(부록 Q1~Q10), 객관식은 ‘명목형 3문항’과 ‘연속형 3문항’으로 제시하였다. ‘명목형 문항’으로 기존에 챗GPT와 같은 AI를 글쓰기에 사용한 경험이 있는지와 AI 글쓰기 도구가 어떤 점에서 가장 도움이 되었는지를 조사하였다. 우선 AI 도구를 글쓰기에 사용한 적이 있는지 조사하였더니 [그림 3]과 같이 나타났다.
[그림 3]
AI 도구 사용 경험
kjge-2024-18-5-159-gf3.jpg
[그림 3]에서 보듯이, 74.1%의 학생이 AI를 활용하여 글쓰기를 한 경험이 있다고 나타났다. 대부분 학생은 챗GPT와 같은 생성형 AI를 활용하여 글쓰기 과제에 도움을 받고 있었다. 그렇다면 AI 글쓰기 사용 경험이 AI 자동 평가 피드백 프로그램인 ‘키위티’를 사용하는 데에 있어서 만족도 차이가 있는지를 살펴보았다. 실제로 AI 도구를 글쓰기에 활용했던 집단이 AI 자동 평가 피드백 만족도(Q4, Q6)와의 영향성은 <표 2>와 같이 나타났다. 이를 해석하면 기존 AI를 글쓰기에 사용한 경험이 있거나 없다고 해서 ‘키위’ 도구를 사용하여 글쓰기 수업을 한 것에는 유의미한 영향을 미치지 않은 것으로 파악된다. 다시 말해, ‘키위’라는 AI 평가 피드백 도구가 기존 활용해 오던 AI 도구와 특정한 연관성을 지니지 않는다는 것이다. 그렇다면, AI를 활용하지 못하더라도 교양수업에서 ‘키위’를 활용하여 자신의 글을 평가받을 수 있고, 자신이 원하는 목적에 따라 챗GPT와 같은 생성형 AI를 활용할 수도 있다는 것을 의미한다. 오히려 이 결과는 반드시 ‘키위’라는 평가 피드백 도구일 필요는 없다 하더라도 학생들이 다양한 AI를 활용하여 글쓰기 과제를 흥미롭게 접근한다면 AI 도구를 반영한 교수학습 설계가 개발되어야 함을 확인해 볼 수 있다. 어쨌든지, 분석 결과 기존 글쓰기 과제에서 기존 AI의 사용 경험이 이번 교양 글쓰기 수업에서 활용한 AI 자동 평가 글쓰기 프로그램인 키위티 사용의 만족도에 영향을 주지 않는다고 확인되었다.
<표 2>
AI 도구 사용 경험 유무에 따른 ‘키위’ 사용의 만족도 차이
경험 O 경험 X df t p

Mean Std Mean Std
Q4 4.33 0.57 4.41 0.59 83 -0.53 0.60


Q6 4.14 0.50 4.32 0.48 -1.43 0.16
다음으로 연속형 문항에 대해서 Cronbach’s alpha로써 신뢰성을 검증하였다. 이번 설문에서 Cronbach’s alpha 값이 0.72로 나왔는데, 문항 수가 적음에도 불구하고 0.7 이상으로 문항이 일관된 방식으로 응답하였다고 판단된다. 연속형 문항은 AI 글쓰기 피드백이 학습자들에게 미친 구체적인 영향을 평가하기 위해 설계되었고, 각 문항의 분석을 토대로 AI 피드백이 학습자의 경험에 미친 효과를 심층적으로 이해할 수 있다.
연속성 문항에 대한 분석은 다음과 같다. ‘Q3. AI 글쓰기 피드백의 정확성’에 대하여 이 문항의 평균은 3.89로, 응답자들은 AI 피드백의 정확성을 대체로 긍정적으로 평가한 것으로 나타났다. 응답 분포는 약간 부정적인 응답으로 치우쳤지만(왜도 -0.55), 대부분 응답자가 긍정적인 평가를 했다. 이는 AI 피드백이 대체로 신뢰할 수 있고 정확하다고 인식되었다. 다음으로 ‘Q4. AI 글쓰기 피드백이 글쓰기 개선에 도움’에 대한 문항의 평균은 4.35로, 학습자들이 AI 피드백을 통해 글쓰기 실력이 실제로 향상되었다고 생각하는 비율이 매우 높았다. 거의 대칭적인 분포(왜도 -0.18)로 응답이 고르게 나타났으며, 첨도는 약간 낮지만 이는 큰 문제로 보이지는 않는다. 이 결과는 AI 피드백이 학습자들의 글쓰기 향상에 긍정적인 영향을 미친 것으로 볼 수 있다. 마지막으로 ‘Q6. AI 글쓰기 피드백 사용이 학습 동기와의 영향성’에 대하여 이 문항의 평균은 4.19로, 학습자들이 AI 피드백이 학습 동기를 향상하는 데에 기여한 것으로 나타났다. 왜도는 0.35로 약간 우측으로 치우쳤지만, 여전히 대체로 긍정적인 평가가 주를 이룬다. 이는 AI 피드백이 단순한 기술적 개선 외에도 학습자들의 동기 부여 측면에서도 중요한 역할을 했다는 것을 의미한다.
<표 3>에서 보듯이 측정변수가 정규성을 만족하려면 왜도(skewness)가 ±3 이하, 첨도(Kurtosis)가 ±10 이하여야 하는데 연속형 문항(Q3, Q4, Q6)은 정규성을 만족하며, 독립적으로 시행되었으므로 <표 4>와 같이 독립표본 검정을 시행하였다.
<표 3>
연속성 문항에 대한 신뢰성 검증
Count Mean Std Range(min-max) Skewness Kurtosis
Q3 85 3.89 0.62 2-5 -0.55 1.31

Q4 85 4.35 0.57 3-5 -0.18 -0.70

Q6 85 4.19 0.5 3-5 0.35 0.32
<표 4>
독립표본 검정(One Sample t-test)
Hypothesis Mean T statistics p-value 95% CI
Q3 H0:μ1=3.5↓
vs
H1:μ1>3.5↩
3.89 5.88 <0.0001 3.76 ~ 4.03


Q4 4.35 13.77 <0.0001 4.23 ~ 4.47


Q6 4.19 12.69 <0.0001 4.08 ~ 4.29
통계 분석 결과, 세 개의 설문 문항(Q3, Q4, Q6) 응답 평균이 3.5 이상이므로 각 문항에 대한 t-검정 결과가 통계적으로 유의하다고 판단된다(p-value < 0.0001). 이는 AI 글쓰기 피드백 프로그램이 학생들에게 긍정적인 영향을 주었다고 할 수 있다. ‘Q3. AI 글쓰기 피드백의 정확성’에 대해서 귀무가설(H₀: μ₁ = 3.5)에 대한 검정에서 평균은 3.89로, 3.5보다 유의하게 높게 나타났다(T = 5.88, p < 0.0001). 95% 신뢰구간(3.76 ~ 4.03)은 3.5를 초과하는 값으로 구성되어 있어, AI 피드백의 정확성에 대해 학생들이 긍정적으로 평가했음을 확인할 수 있다. 이는 AI 피드백이 학습자들에게 신뢰할 만한 피드백을 제공했다는 점을 시사한다. 다음으로 ‘Q4. AI 글쓰기 피드백이 글쓰기 개선에 도움’에 대해서 평균 4.35는 T값 13.77로 매우 높은 유의미성을 나타냈으며, 95% 신뢰구간은 4.23에서 4.47로 설정되었다. 이는 학생들이 AI 피드백을 통해 글쓰기 능력에 실질적인 향상을 경험했음을 의미한다. 이러한 결과는 AI 피드백의 효과가 단순한 인식에 그치지 않고 실제 개선에 도움이 되었음을 강하게 뒷받침한다. 끝으로 ‘Q6. AI 글쓰기 피드백 사용이 학습 동기와의 영향성’에 대해서 평균 4.19로, 이 또한 T값 12.69로 매우 유의미하게 높았다. 95% 신뢰구간(4.08 ~ 4.29)도 3.5를 초과하는 값을 포함하고 있는데, 이는 AI 피드백이 학생들의 학습 동기에도 긍정적인 영향을 미쳤음을 시사한다. 다시 말해, AI 글쓰기 피드백이 학습 과정에서 중요한 동기 부여 역할을 했음을 알 수 있다.
설문조사 분석 결과, AI 피드백 프로그램이 학생들의 글쓰기 실력, 만족도, 학습 동기 향상에 긍정적인 영향을 미쳤음을 확인할 수 있다. 이는 첫 번째 연구 문제와 관련하여 AI 글쓰기 자동 평가 피드백 도구에 대한 학습자 인식과 태도에서 ‘AI 자동 평가가 정확하며, AI 글쓰기 피드백이 학습 동기 부여에 긍정적인 영향성을 가져왔다고 판단된다. 구체적으로 AI 자동 평가 피드백이 얼마나 정확한가를 묻는 항목에 대해서 11%는 매우 정확함, 70%는 정확함으로 나타나 전체 81%가 AI 자동 평가 결과가 정확하다고 인식하고 있었다. 세부 의견으로는 형식적 부분으로 ‘어휘나 어법 교정이 정확하고 가독성이 좋게 수정되도록 피드백을 준다’가 있었고, ‘중복된 표현 등을 잘 알려줌’, ‘맞춤법, 문법 고치는 데에는 훌륭합니다’, ‘문법, 단어, 구조 형성에 도움이 잘 된다’ 등이 있었다. AI 자동 평가 도구가 글쓰기 수업에 긍정적인 학습 동기를 부여하는가에 대한 결과로, 매우 긍정적이 24%, 긍정적이 71%로 대체로 95%가 AI 글쓰기 도구가 학습 동기에 긍정적인 영향을 미친 것으로 파악되었다.
두 번째 연구 질문과 관련해 AI 글쓰기 피드백이 학습자의 글쓰기 능력 향상에 효과적으로 활용되었는지를 확인하였고 다음과 같이 나타났다.
학습자에게 AI 글쓰기 피드백 도구에서 가장 도움이 된 기능이 무엇인지를 복수 선택으로 조사하였는데 [그림 4]처럼 나타났다. 우선 ‘문법 및 맞춤법 수정(29.7%)’이 가장 높았고, 다음으로 ‘문장의 형태와 구조 수정(22.4%)’, ‘표현에 대한 수정(20.8%)’, ‘단어 선택 수정(16.7%)’ 순으로 나타났다. 주로 맞춤법을 포함한 어법, 문장의 형태와 구조, 표현에 관한 피드백에서 글쓰기 향상에 도움이 되었다고 답변하였다. 이는 문장 쓰기, 단락 쓰기에 활용하기에 적합하고 AI 글쓰기 피드백 도구가 문장, 문법, 표현 수정에서 효과적으로 적용될 수 있음을 시사한다. 이에 비해, ‘장르에 맞는 글의 구성을 수정(7.8%)’하거나 ‘주제 및 아이디어 수정(2.1%)’ 측면에서는 AI 글쓰기 피드백 도구가 그다지 도움을 주지 못한 것으로 보인다.
[그림 4]
AI 글쓰기 도구의 효용성
kjge-2024-18-5-159-gf4.jpg
다음으로는 ‘AI 글쓰기 피드백 도구’를 교양수업에 활용하기 위하여 어떤 부분을 개선하거나 보완해야 할지를 사용자의 측면에서 설문 조사하였다.
[그림 5]에서 보듯이, AI 글쓰기 피드백 도구는 실제로 개인별 맞춤형의 피드백이 미흡(38.8%)하다는 아쉬움이 있었다. 다음으로는 ‘사용자 인터페이스(가입, 피드백)가 쉽게 구현되지 않아 이해하기 어렵다(18.8%)’라는 의견이 있었고 ‘오류 수정 사항에 대한 이해가 어려움(16.5%)’으로 나타나, 피드백이 좀 더 쉽게 설명될 필요가 있다. 또한 ‘피드백 내용 분석에 대한 설명이 구체적이지 않음(12.9%)’, ‘글에 대한 정확한 분석이나 평가가 이루어지지 않음(12.9%)’으로 글에 대하여 구체적인 피드백 내용과 글에 대한 분석과 평가가 정확하게 제시되어야 한다. 이는 AI 글쓰기 도구가 지니는 한계로 향후 개선 방향으로 적용하거나 교수자가 피드백을 줄 때에는 AI 글쓰기 도구로 충족되지 않는 점을 위주로 피드백하는 것이 효과적일 것이다.
[그림 5]
AI 글쓰기 피드백 프로그램(키위티) 사용에 어려운 부분
kjge-2024-18-5-159-gf5.jpg
마지막으로 세 번째 연구 질문과 관련하여 AI 자동 평가 피드백 도구를 대학 글쓰기 교양교육의 수업에 어떻게 반영되면 좋겠는지를 서술형 문항의 답변 결과를 분석하였다. 대부분 의견이 과제 제출 전에 자신이 작성한 글을 점검할 때 활용되면 좋겠다는 응답이 많았다.
<표 5>에서와 같이, 학생들은 AI 자동 평가 피드백 도구를 활용하여 자신의 글을 점검하고 AI 피드백이 글쓰기 향상에 도움이 된다고 보았다. 구체적으로는 맞춤법, 문장, 문법 표현 수정에서 활용하면 좋겠다는 견해가 많았고, 고쳐쓰기를 위해서 도움이 된다고 응답하였다. 이에 반해서 AI 글쓰기 피드백을 오롯이 신뢰하기 어렵기 때문에 글쓰기의 보조 도구로만 사용하자는 견해도 있었다. 학생들이 AI 도구를 활용하여 기존 글쓰기 경험을 확장하고 AI 피드백 결과를 동료들과 나누면서 협력적으로 글쓰기 역량을 기를 수 있음을 확인할 수 있었다.
<표 5>
학생 설문조사 서술형 내용 예시
• 처음에는 원래 쓰던 대로 써보고, AI 피드백을 이용해 계속 수정하면서 써보면서 처음에 쓴 글과 나중에 쓴 글을 비교해 보면서 활용하기
• 글쓰기를 해야 하는 과제가 있을 때 피드백을 받고, 문법 공부에 사용되면 좋을 것 같다. 예시를 논할 때에도 사용하면 좋을 것 같다.
• 자신이 쓴 글에 대해 교수님이 아닌 AI에게 피드백을 받아볼 수 있다는 점이 좋았고, 글쓰기 수업에 활용된다면 글쓰기 능력(어휘, 문단)을 향상시키는 데 많은 도움이 될 것 같습니다.
• 주변의 도움없이 온전히 자신만의 글을 써보고 피드백을 통해 자기의 약점을 정확하게 파악하고 그것을 중점으로 글쓰기 연습을 해보는 것이 실질적인 글쓰기 능력 향상에 도움을 준다고 생각한다. 특히나 다양한 장르의 글을 자주 써보는 것이 좋겠다.
• AI를 다 믿을 수 있는 건 아니라고 생각해서 AI 글쓰기 피드백을 중점으로 두기보단 부가적인 기능으로 사용했으면 좋겠다.
• 교수님들께서 너무 신뢰하지 않았으면 한다. 인용을 하지 않으면 복사 붙여넣기를 했다고 판정이 나는 글도 있었다. 인용을 넣으니 바로 잘 쓴 글이라고 나온 적이 있어서 전적으로 믿지는 못하겠다.

5. 결론

대학 교양교육에서 AI 자동 평가 피드백의 적용은 교육의 질을 개선하고, 교수자의 부담을 줄이며, 학생들에게 즉각적인 피드백을 제공하는 등 다양한 효용성이 있다. 이 연구에서는 이와 같은 AI 자동 평가 피드백이 교양교육 과정에서 미치는 영향을 검토하고 교육 기술 발전이 교양교육 과정에 어떻게 적용될 수 있을지 학생 인식 조사 연구를 통해 살펴보았다. AI 자동 평가 피드백이 학습자의 글쓰기 동기 부여에 긍정적인 영향을 미쳤다는 것과 실제로 AI의 평가 결과가 ‘정확성’ 측면에서 81%가 정확하다고 인식했다. 특히, 맞춤법 수정, 어휘, 문법, 표현 수정에 대해서는 학생들의 만족도가 높게 나타났다. 이로써 AI 자동 평가 피드백은 교양교육에서 긍정적으로 활용될 필요가 있으며 교수자의 업무 부담을 덜어줄 뿐만 아니라 학습자의 동기 부여 측면에서도 긍정적이라는 것을 확인할 수 있었다.
이 연구는 S대학교 교양 글쓰기 수업에서 대학생의 글을 AI 자동 평가 피드백 도구(키위런)를 활용하여 분석함으로써 교육 환경에서 적용이 가능한 글쓰기 평가 방안을 모색하고, 수업에서 AI 자동 평가 피드백이 활용될 때 나타나는 유용성과 한계를 짚어보았다. 앞으로 대학 글쓰기의 평가 지표에 대한 타당성이나 구체적인 준거에 대한 논의는 추가 보완되어야 할 것이다. AI 자동 평가 피드백 도구가 대학 글쓰기 교양교육에 어떻게 반영되어야 할지 좀 더 심층적으로 검토해야 하는 한계가 있다. 그렇지만 이 논의가 AI 자동 평가 피드백이 교양교육에 미치는 긍정적인 영향과 교육 방식에 도입할 때 고려해야 할 주요 쟁점과 시사점을 논의했다는 점에서 의의를 지닌다. 이 연구 결과 기존 글쓰기 수업에서 피드백이 주는 부담을 AI로 일부 해소할 수 있다고 보았다. 이 연구 분석 결과, 맞춤법, 문법, 표현, 어휘 등은 AI 자동 평가 프로그램을 활용하고 교수자는 내용적 측면에서 피드백하는 방안을 제안해 볼 수 있다. 학습자도 AI 글쓰기 피드백을 긍정적으로 인식하고 있으며 글쓰기 과제를 수행할 때도 이를 유용한 도구로 활용할 수 있음을 보였다. 나아가 AI 시대에 교양교육의 혁신을 모색하기 위하여 이 논의가 AI 리터러시 함양 및 AI 글쓰기의 교육적 가치를 확인한 실제적 연구가 되었기를 기대한다.

Notes

1) 인하대학교 교육빅데이터 응용연구센터의 한국어 에세이 자동 채점 프로그램(https://www.ebapasta.com/) 등이 있다.

2) ‘글쓰기 채점도 AI 시대’ https://www.newspim.com/news/view/20230830000972

참고문헌

Ahn, M(2023 Changes and direction of university liberal arts education in the age of AI, Journal of Liberal Arts Education Studies 8(2), 229-256. http://dx.doi.org/10.23115/JLAERI.2023.08.02.229.

[안미영. (2023). AI시대 대학 교양교육의 변화와 방향성 일고. 대학교양교육연구, 8(2), 229-256. http://dx.doi.org/10.23115/JLAERI.2023.08.02.229].

Cha, J, Choi, S, Lee, K(2024). A comparative study of AI-based writing assessment tools and human evaluators:Focusing on book report texts, Korean Language and Literature in International Context 102:681-705.
crossref
[차준우, 최서희, 이기성. (2024). 인공지능 기반 쓰기 평가 도구와 글쓰기 평가자의 비교 연구: 독후감 텍스트를 중심으로. 국제어문 102, 681-705.

Chen, C. F. E, Cheng, W. Y. E. C(2008). Beyond the design automated writing evaluation:Pedagogical practices and perceived learning effectiveness in EFL writing classes, Language Learning &Technology 12(2), 94-112.

Grimes, D, Warschauer, M(2010). Utility in a fallible tool:A multi-site case study of automated writing evaluation, Journal of Technology, Learning, and Assessment 8(6), 1-44.

Gu, J(2020). A study on the necessity and application of national university college writing research, Korean Journal of General Education 14(1), 131-147.

[구자황. (2020). 전국 수준 대학 글쓰기 연구의 필요성 및 활용 방안 고찰. 교양교육연구, 14(1), 131-147.].

Hanane, O. U. I. S(2023). The effects of Chat GPT technology use on enhancing ESP students'writing proficiency, The case of master one students at the faculty of economic, commercial, and management sciences at Chadli Bendjedid University, ELTARF.

Kim, K(2024 A way of university writing education in the era of generative AI-Focused on use of generative AI in argumentative writing, Urimalgeul:The Korean Language and Literature 101:63-86. http://doi.org/10.18628/urimal.101..202406.63.
crossref
[김규훈. (2024). 생성형 AI 시대의 대학 글쓰기 교육 방향: 논증적 글쓰기에서 생성형 AI 사용을 중심으로. 우리말글, 101, 63-86. http://doi.org/10.18628/urimal.101..202406.63].

Kim, S(2021 A study on the design method of an automated writing evaluation(AWE) system that can be used in classroom-Based writing assessment - considering the Rater's cognitive load factor and the cognitive eng, Journal of CheongRam Korean Language Education 83:157-203. http://doi.org/10.26589/jockle..83.202109.157.
crossref
[김승주. (2021). 교실 단위 작문 평가에서 활용 가능한 작문 자동 채점 프로그램의 설계 방안에 대한 연구. 청람어문교육, (83), 157-203. http://doi.org/10.26589/jockle..83.202109.157].

Kim, S(2022). Analysis of overseas trends in the study of automated essay scoring using keyword network analysis methods, The Journal of Korean Language and Literature Education 80:45-93.

[김승주. (2022). 키워드 네트워크 분석 방법을 활용한 국외 글쓰기 자동채점 연구 동향 분석: 인문학 및 사회과학 영역의 학술지 논문을 중심으로. 국어교육연구, 80, 45-93.].

Lee, B(2024 Writing instruction method using generative artificial intelligence(AI), The Journal of Learner-Centered Curriculum and Instruction (JLCCI) 24(14), 171-189. http://doi.org/10.22251/jlcci.2024.24.14.171.
crossref
[이빛나. (2024). 생성형 인공지능(AI)을 활용한 글쓰기 지도 방안. 학습자중심교과교육연구, 24(14), 171-189. http://doi.org/10.22251/jlcci.2024.24.14.171].

Lee, H. (2023 August 31)Writing grading is also in the AI era... 'K Robot'contributes, Newspim, https://www.newspim.com/news/view/20230830000972

[이현경. (2023.8.31.). 글쓰기 채점도 AI 시대...‘K로봇’으로 이바지. 뉴스핌. https://www.newspim.com/news/view/20230830000972]

Lee, J, Jung, J, Kim, H(2023). Features of automated essay evaluation of Korean language learners'writing:Focusing on content and structure, Korean Language and Literature in International Context 99:433-471.
crossref
[이진, 정진경, 김한샘. (2023). 한국어 학습자 쓰기 자동채점을 위한 자질 연구: 내용 및 구조 관련 채점 자질을 중심으로. 국제어문, 99, 433-471.].

Lee, Y, Shin, D, Kim, H(2022). Exploring the feasibility in applying an automated essay scoring to a writing test of Korean language, Bilingual Research 86:171-191.

[이용상, 신동광, 김현정. (2022). 한국어 쓰기 평가를 위한 자동채점의 가능성 탐색. 이중언어학, (86), 171-191. http://dx.doi.org/10.17296/korbil.2022..86.171].

Lee, Y, Kim, H(2023). Deep neural network-Based automated essay trait scoring model incorporating argument structure information, Korean Institute of Information Scientists and Engineers (Journal of KIISE) 50(8), 662-670.
crossref
[이예진, 김학수. (2023). 논증 구조 정보를 통합한 심층 신경망 기반 에세이 특성 자동 평가 모델. 정보과학회논문지, 50(8), 662-670. http://10.5626/JOK.2023.50.8.662].

Li, J, Link, S, Hegelheimer, V(2015 Rethinking the role of automated writing evaluation(AWE) feedback in ESL writing instruction, Journal of Second Language Writing 27:1-18. https://doi.org/10.1016/j.jslw.2014.10.004.
crossref
Link, S, Mehrzad, M, Rahimi, M(2022 Impact of automated writing evaluation on teacher feedback, student revision, and writing improvement, Computer Assisted Language Learning 35(4), 605-634. https://doi.org/10.1080/09588221.2020.1743323.
crossref
Milanovic, M, Saville, N, Shuhong, S(1996). A study of the decision-making behaviour of composition markers, In Studies in language testing, 3:92-111. PressCambridge University Press.

Noh, E, Song, M. Y, Park, J. I, Kim, Y, Lee, D. G(2016 Advanced refinements and application of automated Scoring system for Korean large-scale assessment (RRE 2016-11), Korea Institute of Curriculum &Evaluation https://doi.org/10.23000/TRKO201900002353.
crossref
[노은희, 송미영, 박종임, 김유향, 이도길. (2016). 한국어 문장 수준 서답형 문항 자동 채점 프로그램 고도화 개발 및 적용 (연구보고서 RRE 2016-11). 한국교육과정평가원. https://doi.org/10.23000/TRKO201900002353].

Paik, H(2024). A case study of a writing class using AI writing feedback:Focusing on SunChon national university's “Thinking and writing”, Proceedings of 2024 The joint conference of the Institute for Liberal Arts Education of Sookmyung Women's University and DaVinci Institute for the Future of Liberal Arts Chung-Ang University, 87-97. The Korean Association of General Education.

[백혜선. (2024). AI 글쓰기 피드백을 활용한 글쓰기 수업 사례 연구: 순천대 <사고와 글쓰기>를 중심으로. 숙명여자대학교 교양교육연구소⋅중앙대 다빈치미래교양연구소 공동학술대회 발표 자료 (pp. 87-97). 한국교양교육학회.].

Park, N(2023 Navigating the paradigm of liberal arts education in the age of AI, General Education and Citizen 8:7-41. http://doi.org/10.47142/GEC.8.1.
crossref
[박남기. (2023). AI 시대의 대학 교양교육 패러다임 탐색. 교양교육과 시민, 8, 7-41. http://doi.org/10.47142/GEC.8.1].

Park, J, Choi, S, Park, G, Kim, G(2023). Exploring artificial intelligence-based automated essay scoring methods using the scoring feature, Journal of CheongRam Korean Language Education 96:135-172.

[박종임, 최숙기, 박강윤, 김길재. (2023). 채점자질을 활용한 인공지능 기반 글쓰기 자동채점 방안 탐색. 청람어문교육, (96), 135-172.].

Park, S. Y, Lee, B, Hong, Y(2024). An exploratory study on developing the AI essay test tool based on ChatGPT:Focusing on the interaction with the engineer, JPEE 16(1), 21-31.

[박소영, 이병윤, 홍유정. (2024). ChatGPT를 활용한 AI 글쓰기 의사소통 역량 평가도구 개발 과정에 대한 연구: 기술 전문가와의 상호소통을 중심으로. 실천공학교육논문지, 16(1), 21-31.].

Son, S(2020). Didactical reexamination on liberal arts education in the age of AI, Korean Journal of General Education 14(4), 11-23.
crossref pdf
[손승남. (2020). AI 시대 교양기초교육의 교수학적 재음미. 교양교육연구, 14(4), 11-23.].

Yu, D, On, B. W(2022). Latest research trend of creative text classification model, Proceedings of KIIT Conference 14(4), 444-448.

[유대곤, 온병원. (2022). 텍스트 문서의 창의성 평가 모델 최신 연구 동향. 한국정보기술학회 종합학술발표논문집, 444-448.].

Appendices

<부록>
설문조사 내용
번호 문항 종류 설문 내용
Q1 명목형 AI를 글쓰기에 사용한 경험이 있습니까?

Q2 명목형 AI 글쓰기 피드백 도구에서 가장 도움이 된 기능이 무엇입니까?

Q3 연속형 AI 글쓰기 피드백의 정확성에 대해서 어떻게 생각합니까?

Q4 연속형 AI 글쓰기 피드백을 받은 후, 자신의 글쓰기 개선에 도움이 되었다고 생각합니까?

Q5 명목형 AI 글쓰기 피드백 도구(키위티)를 사용하면서 가장 큰 어려움이 무엇이었나요?

Q6 연속형 AI 글쓰기 피드백 사용이 학습 동이에 어떠한 영향을 미쳤습니까?

Q7 서술형 AI 글쓰기 피드백이 실제 글쓰기 및 수업에서 어떻게 활용되었으면 좋을지 자유롭게 기술하십시오.

Q8 서술형 AI 글쓰기 피드백 도구의 장점과 단점을 자유롭게 기술하십시오.

Q9 서술형 AI 글쓰기 피드백과 담당 교수의 피드백 중에서 선호하는 것은 무엇이며, 그 이유는 왜 그렇습니까?

Q10 서술형 AI 글쓰기 피드백 도구를 사용한 소감은 무엇입니까? 향후 개선되었으면 하는 점 등 자유롭게 기술하시오.


ABOUT
ARTICLE CATEGORY

Browse all articles >

BROWSE ARTICLES
EDITORIAL POLICY
AUTHOR INFORMATION
Editorial Office
203-827. Chung-Ang University
84, Heukseok-ro, Dongjak-gu, Seoul, Republic of Korea, 06974
Tel: +82-2-820-5949    E-mail: hangang331@cau.ac.kr                

Copyright © 2022 by The Korean Association of General Education.

Developed in M2PI

Close layer
prev next