생성형 AI 텍스트와 인간 텍스트의 내용 및 문체 비교 연구-대학 글쓰기의 한계와 가능성
A Comparative Study of Generative AI and Human Texts: Limits and Possibilities of Academic Writing
Article information
Abstract
본 연구는 생성형 AI의 활용 여부에 따라 대학생 작문 과제의 내용 및 문체가 어떠한 차이를 보이는지 분석하고, 그 교육적 함의를 탐색하는 데 목적을 두었다. 최근 대학 글쓰기에서 생성형 AI 활용이 급속히 확산되고 있으나, 실제 학습자 글쓰기에 미치는 영향을 비교한 연구는 부족하다. 이에 본 연구는 서울 소재 D대학교 교양과목 <21세기생명생태철학>에서 2021학년도(생성형 AI 비활용)와 2025학년도(생성형 AI 활용)의 학기 말 과제물 총 69편을 수집하여, 차이점을 고찰하였다. 연구 방법으로는 텍스트마이닝을 채택하여 문장 길이, 어휘 다양성(TTR⋅MATTR), 접속부사 및 연결표현 빈도 및 다양성, 감성 점수를 정량적으로 비교하였다. 동시에 해당 교과목을 운영한 교수자의 관점에서 전개 방식, 문체적 특징, 참고문헌 활용 양상 등을 정성적으로 검토하였다.
분석 결과, 2025학년도 AI 활용 글은 2021학년도 인간 작성 글보다 문장이 짧고 간결했으며, 어휘 다양성은 전반적으로 낮게 나타났다. 접속 부사의 빈도와 다양성에서는 유의미한 차이가 없었으나, AI 활용 글에서는 조건 접속사 대신 예시⋅강조 접속사가 빈번하게 나타나는 특징이 관찰되었다. 감성 분석에서는 두 집단 간 차이가 드러나지 않았으나, 교수자 관점에서는 AI 활용 글이 개별 학생의 사유보다는 사고의 획일화와 문체의 유사성이 두드러진다는 점이 확인되었다. 특히 일부 과제에서는 실제 존재하지 않는 참고문헌이나 검증되지 않은 인용이 등장하여 AI의 환각(hallucination) 문제가 드러났다. 반면 일부 학생들은 AI 도구의 활용 목적과 과정을 명시적으로 기재하거나 자료 탐색의 보조 수단으로만 제한하는 등 비판적 활용 태도를 보이기도 하였다.
이러한 결과는 대학 글쓰기에서 AI 활용을 단순히 금지하거나 제한하는 방식으로는 교육적 효과를 충분히 거둘 수 없음을 보여준다. 학습자가 AI를 주체적으로 활용하되 결과물의 사실성 검토와 비판적 해석을 병행할 수 있도록, 대학의 수업 설계와 평가 체계를 재정비할 필요가 있다. 이러한 맥락에서 본 연구는 대학 글쓰기 교육에서 AI 활용의 가능성과 한계를 균형 있게 탐색하기 위한 기초 자료를 제공한다는 점에서 의의가 있을 것이다.
Trans Abstract
This study examines how the use of generative AI tools influences the content and style of university students’ writing and explores its educational implications. Despite the rapid spread of generative AI such as ChatGPT in higher education, empirical comparisons of its actual impact on student writing remain limited. To address this gap, 69 term papers were collected from the liberal arts course the ‘Philosophy of Life and Ecology in the 21st Century’ at D. University in Seoul, covering two cohorts: 2021 (without AI) and 2025 (with AI). A mixed-methods approach was adopted: text-mining techniques were employed to quantitatively compare sentence length, lexical diversity (TTR, MATTR), conjunction use, and sentiment scores, while the course instructor qualitatively reviewed rhetorical features, writing style, and reference practices.
The analysis showed that AI-assisted papers were shorter and more concise, with lower lexical diversity than those written without AI. While overall conjunction frequency and variety revealed no significant difference, AI-assisted writing tended to rely more on illustrative and emphatic connectors rather than conditional ones. Sentiment scores were largely similar across both groups; however, from the instructor’s perspective, AI-assisted writing often reflected uniformity of thought and style, sometimes including fabricated references, which revealed the issue of AI hallucination. At the same time, a few students demonstrated critical engagement by explicitly reporting how and why they used AI tools.
These findings suggest that prohibiting AI use in academic writing is insufficient. Instead, pedagogical design and assessment criteria should guide students to employ AI critically and creatively while ensuring fact-checking and personal interpretation. This study offers empirical evidence on the opportunities and challenges of AI-assisted writing, providing a foundation for balanced discussions in higher education.
1. 서론
생성형 AI(Generative AI)의 도입은 교육 현장에 글쓰기의 의미와 방식에 근본적인 변화를 일으키고 있다. 본 연구는 궁극적으로 ‘생성형 AI를 활용한 글과 인간이 작성한 글이 어떤 차이를 보이는가?’라는 의문에서 시작되었다. 2023년 초까지만 해도 교육 현장은 AI 사용으로 인한 표절, 편향성 등 윤리적인 문제와 부적절한 활용에 대한 대안 마련에 분주하였고 초기에는 우려에 대한 방어적인 대응을 보였었다. 그러나 AI 사용을 통제하는 것만으로는 효과적인 대응이 어렵다는 인식이 확산되면서 교육 현장의 태도는 AI와 인간의 신중한 협력을 모색하는 방향으로 변화하고 있다(Bank, 2023.5.18.; Yau & Chan, 2023.2.17.). 홍콩대학교(Hong Kong University)은 2023년 2월 수업 과제에서 허가 없는 AI 도구의 사용을 표절로 간주하였으나, 같은 해 9월에는 AI 도구를 조건부 허용으로 전환했다(Yau & Chan, 2023.2.17.). 뉴욕시 교육청 역시 2023년 1월에는 공립학교 네트워크에서 ChatGPT 접속을 전면 차단하였으나, 같은 해 5월에는 차단을 해제하였다(Bank, 2023.5.18.).
교육에서 생성형 AI의 활용은 단순한 기술의 도입 차원을 넘어 교육의 질적 향상과 교수-학습 방식 전반에 영향을 미치고 있다(신소영, 2025). AI 소프트웨어의 한 형태로 텍스트, 이미지, 오디오, 비디오 등 다양한 결과물 생성이 가능해지면서 교육에서는 교육자료 제작, 콘텐츠의 요약, 아이디어 발상, 영상 제작 등 다양한 교수-학습 활동에 활용되기 시작하였고, AI를 활용한 연구 사례들이 지속적으로 보고되고 있다. 예를 들어, 영어교육에서 생성형 AI를 활용한 질문 응답으로 학습자의 자기주도적 문제해결능력을 유도한 사례(신동광 외, 2023), ChatGPT를 중등 영어 교수 자료로 활용한 사례(김태국, 2023), AI 활용한 영상 제작 중학교 수업 사례(양일동, 2024), AI 영상 제작을 융합디자인 강의에 적용한 사례(변아영, 김효정, 2022) 등이 있다. 글쓰기 영역에서는 김소륜, 조남민(2025)가 생성형 AI를 활용한 창의적 글쓰기 교수설계안을 제안하였고, 곽수범(2024)는 대학 글쓰기 수업에 생성형 AI를 활용한 글쓰기 과정을 도입하여 학습자의 경험을 분석하였다. 국외에서는 스탠퍼드대학교(Stanford University)의 Co-author 프로젝트에서 생성형 AI(GPT 3)가 초안이나 아이디어를 제시하고 사람이 글을 수정하여 완성하는 협업 글쓰기 실험을 진행하고 작성자의 경험을 분석하기도 하였다(Lee et al., 2022). Pellas(2023)는 학부생을 대상으로 한 비교 연구에서, 생성형 AI 플랫폼이 대학생들의 서사적 지능과 글쓰기 자기 효능감을 높이는데 효과적이라고 보고하였다. 또한 Li(2025)는 학술 글쓰기에서 생성형 AI의 핵심기술인 LLM(Large Language Model)이 아이디어 도출과 수정 과정에서 수행할 수 있는 역할을 교수설계 관점에서 탐색하였으며, Holzner et al.(2025)는 AI와의 협업 글쓰기에 대한 장점과 한계점을 메타분석을 통해 제시하였다.
글쓰기 영역에서 AI 활용이 많아지면서 주목할 이슈로, 인간 저자(Author)와 생성형 AI의 경계가 모호해지는 현상이 제기되고 있다. 대학생 A는 생성형 AI인 클로드(Claude)를 사용해 과제를 작성한 후 “아무것도 기억에 남지 않는다”, “AI 사용이 오히려 인내심을 약화시킨다”고 했으나 성적은 A-와 B+로 긍정적인 평가를 받은 경우도 있다(Hsu, 2025.6.30.). 작가 Meghan O’Rourke는 GPT 사용 경험이 축적되면서 AI 결과는 정확해졌지만, 스스로가 복제품처럼 느껴졌으며 사고를 AI에 ‘외주화’하게 되었다고 언급하였다(O’Rourke, 2025.7.18.). 이러한 사용자들의 경험은 생성형 AI가 단순히 도구를 넘어 ‘공동 작업자’가 되면서 인간과 도구의 경계가 모호해지고 있음을 시사한다.
이러한 변화는 학생들이 글쓰기 과제에 접근하고 진행하는 방식을 변화시킬 뿐만이 아니라, 수업의 학습 목표, 평가 방식 전반을 재고하도록 요구한다. 생성형 AI 시대의 글쓰기는 AI의 통제와 감시를 넘어 도구를 활용한 협력적 글쓰기를 통해 비판적 사고력 및 학술적 글쓰기 역량 강화로 나아갈 것을 강조하고 있다(Li, 2025; Holzner et al., 2025). 즉, 학생들이 단순히 생성형 AI가 제공하는 생성물을 복사하거나 인용하기보다는 이를 비판적으로 수용하고 재구성할 수 있도록 하는 교수 설계와 전략이 필요하다는 것이다. 이러한 패러다임의 변화는 도구를 활용하는 학생들의 글쓰기를 비롯한 과제와 학습을 위한 자료 접근 방식뿐만이 아니라 교수자의 학습 목표와 평가 방법 및 기준 설정까지 재설계하도록 요구한다(권태현, 2023; 나은미, 2024). 이는 단순한 이해와 작문 능력의 평가를 넘어, 생성형 AI를 매개로 자기 사고를 구성하고 의미 있는 담론을 생산하는 새로운 글쓰기 역량이 요구되는 시대적 전환을 시사한다.
이에 본 연구는 동일 강좌에서 생성형 AI 활용 이전 시점(2021학년도)과 활용이 활성화된 시점(2025학년도)의 작문 과제물을 비교하여, AI 사용이 대학생의 글쓰기에 미치는 영향을 정량적⋅정성적 측면 모두에서 분석을 시도하였다. 특히 문장 구성, 어휘 사용, 표현 방식, 주제 다양성 등의 변화를 중심적으로 비교하였다. 이를 파악하기 위해 연구는 다음의 두 가지로 방향으로 진행되었다. 첫째, 학생들의 AI 도구 사용 여부에 따른 문장 특성의 차이는 텍스트마이닝을 통해 정량적으로 비교 분석하였다. 둘째, 이 강좌를 기획하고 운영한 교수자의 관점과 교육학 전문가의 관점에서 과제물 내용을 비교 분석하여 정성적인 차원의 차이점을 제시하였다. 이러한 결과는 단순한 비교 분석을 넘어 통섭적인 해석을 바탕으로 AI를 활용한 글쓰기 활동 지도에 대한 시사점을 제공할 수 있을 것이다.
2. 선행연구
2.1. 생성형 AI와 교육현장
AI 기술이 본격적으로 도입되면서 교육현장에서는 다양한 형태의 AI 활용 교육이 확산되고 있다. ‘AI활용 교육’, ‘AI기반 교육’, ‘AI교육’은 목적과 기능에 따라 구분되며, 임은선 외(2025)는 이를 AI를 활용한 교육과 AI를 가르치는 교육으로 구분하였다. 더 나아가 UNESCO 정책지침(2021)에서는 AI와 교육의 관계를 AI와 함께 배우기(Learning with AI), AI에 대해 배우기(Learning about AI), AI를 대비하여 배우기(Preparing for AI)로 구분하였다(Holmes et al., 2019; Miao et al., 2021). 이러한 구분은 AI를 도구적, 내용적, 목표적 차원에서 각각 다르게 바라보며 ‘무엇을 위해 AI를 어떻게 가르치고 활용할 것인가’라는 교육의 재구성을 요구한다. ‘AI와 함께 배우기’는 AI를 활용하여 교과 학습을 지원하는 맥락을, ‘AI에 대해 배우기’는 데이터, 기술, 개념, 작동, 원리 등 AI의 원리와 한계에 대한 이해를 목표로, ‘AI에 대비하여 배우기’는 AI가 개인, 사회, 노동시장, 환경에 미치는 현재와 미래의 영향을 고려하여 AI 윤리, 데이터 프라이버시, AI 리터러시 등 시민 역량을 강화하는 교육적 관점이다.
AI와 교육이 단순한 결합이 아니라 인간과 기술이 결합된 시스템적 접근을 필요로 하며, 그 기반에는 AI 시스템에 대한 인간의 통제권을 유지하면서 인간의 능력을 증강하는 것을 추구하는 인간중심의 AI(HCAI: Human-Centered AI), HCD(Human Centered Design)와도 연결된다. HCAI는 기술을 개발하고 사용할 때 인간이 중심이 되어 그들의 필요와 관점을 중심으로 설계되는 것을 의미하며, AI 사용에 있어 인간 요소에 초점을 두고 대화형 시스템을 더 가능하게 만드는 것을 목표로 두고 있다(Schmager et al., 2025). HACI의 핵심 목적 중 ‘증강(augmentation)’은 AI 기술을 사용하여 인간의 능력, 기술, 의사결정 프로세스 능력의 향상과 확장에 초점을 둔다. 결국 교육 분야에서의 AI는 작업을 단순화하는 도구로 사용되면서도, 인간의 비판적 사고와 능동적인 참여를 강조하는 방향으로 가야 한다는 것이다(Schmager et al., 2025). AI는 단순한 작업의 자동화를 넘어 인간과 시너지적 파트너십 모델로 통합되어야 하며, 이 협력 관계는 인간이 주도적으로 주도성(Human agency)이 중심되어야 한다(Li, 2025).
한편, 교수-학습-시스템 측면에서 AI는 다음과 같이 정리될 수 있다. 시스템 측면에서 AI는 학습 행동 데이터의 수집과 분석을 통해 학습자의 이수 및 탈락 예측, 조기 경고, 개인화 추천 등 지원 기능으로 확대되어 사용되고 있다. 대학에서 널리 사용하는 학습관리시스템(LMS)은 학습 콘텐츠 제공과 학습 행동 데이터를 수집⋅분석하는 도구로 자리 잡았고, AI가 접목되며 예측 분석과 조기 개입을 통합하는 방향으로 고도화되고 있다. 초⋅중등 교육과정에서 보고되는 디지털 교과 및 학습 시스템 중에서도 이러한 AI 기반 지능형 튜터링 시스템(ITS: Intelligent Tutoring System) 특성들이 반영되고 있다. 예를 들어 ‘Classting AIDT’는 적응형 진단, 경로 추천과 대시보드 등 개인화 기능을 제공하고, ‘똑똑! 수학탐험대’는 KERIS에서 운영하는 게임형 초등 수학 수업 지원 시스템으로 수업 전후 활동과 맞춤형 관리기능을 제공한다(최지선, 최민선, 2025).
학습자 측면에서, AI는 챗봇 질의응답, 지능형 튜터링 시스템(ITS), 글쓰기 지원 등 학습 전반에서 보조 교사의 역할을 수행하고 있다. 영작 수업에서는 AI 보조 교사를 통해 학생들의 작문 활동에 지속적인 피드백을 제공하고 자가 점검을 촉진하였다(임희정, 2024). 대규모 강좌에서 수업 맥락에 특화한 챗봇을 개발하여 질문 대응과 자율 학습지원을 지원한 사례로 KAIST AI대학원의 <인공지능을 위한 프로그래밍> 강좌를 들 수 있다. 이 강좌에서는 수강생 477명 규모 수업에 가상 조교를 배포하여 3,869건의 Q&A 상호작용을 기록하였고, 절반 이상의 수강생이 이 챗봇을 활용한 이후 조교의 업무 부담이 경감되는 효과가 보고되었다(KAIST News, 2025. 6. 5.). 그 외에도 고등교육에서 학습지원형 챗봇 적용을 다룬 실증 연구들이 축적되고 있다(Sajja et al., 2024).
교수자 측면에서, AI는 강의 자료 및 콘텐츠 제작, 자동 채점, 피드백, 학생 모니터링 등 다양한 방식으로 활용되고 있다. 예를 들어 <초급중국어> 강좌에서는 교수자의 교수 자료 제작 과정에서 ChatGPT를 사용하여 주제 탐색, 어휘 및 문형 연습 자료, 발음 연습 자료, 어휘 보충 자료, 관련 설명 및 예문, 독해 자료, 종합 평가 자료 등을 제작한 사례(정상형, 2024), 제2외국어 수업에서 AI 스피커를 활용해 학습자의 발화 기회를 확대한 사례(홍수민, 임철일, 2021), 디지털 휴먼 교수자와 실제 교수자의 콘텐츠 간의 교수 실재감을 비교한 연구(장민경, 이현우, 2024)도 확인되었다.
2.2. 글쓰기에서 AI 활용의 효과
AI 활용이 교수자 중심에서 학습자 중심으로 확대됨에 따라 학생들의 실제 AI 활용 양상에도 관심이 집중되고 있다. 언어 학습 플랫폼 Preply(2025)는 만 12세 이상의 학생들과 학부모 1,812명을 대상으로 설문조사를 실시한 결과, 학생들이 AI를 가장 자주 사용하는 과목은 1순위 영어(English) 및 문학, 2순위 수학, 3순위 역사임을 보고했다. AI 활용 작업으로는 1순위 읽기 자료 요약 또는 이해, 2순위 에세이⋅보고서 편집, 3순위 수학⋅과학 문제 해결, 4순위 아이디어 및 개요의 브레인스토밍, 5순위 에세이⋅보고서 작성이 상위 순위로 나타났다(Preply, 2025). 이러한 결과는 AI가 대학에서의 에세이 및 보고서 작성이 결과물 산출의 보조적 차원을 넘어 고차원적인 사고를 요구하는 핵심 활동이라는 점을 다시 상기시킨다(안예림, 2024).
글쓰기는 단순히 결과물을 산출하는 기술적 행위에 머물지 않으며, 방대한 정보 속에서 적절한 지식과 자료를 선별하고 구성하고 정당화하는 심화된 사고 과정을 수반하는 작업이다. 비판적 평가 없이 이루어지는 AI 글쓰기는 글쓰기 교육의 본질을 훼손할 수 있다는 문제를 지적하며(나은미, 2024), AI가 글을 대신 작성하더라도 글에 대한 해석과 책임은 여전히 저자에게 있음을 강조하였다. 또한 생성형 AI 기반의 글쓰기는 양질의 질문과 제공된 텍스트를 정제하고 구조화할 수 있는 역량을 전제할 경우에만 교육적 성과로 이어질 수 있다고 보았다(권태현, 2023). 이처럼 AI를 활용한 글쓰기는 단순한 도구 사용을 넘어, 글쓰기 능력의 본질적 요소인 비판적 사고력과 텍스트 통제력을 요구한다는 점에서 교육적 재해석이 필요하다.
한편, AI 글쓰기의 인지적 효과에 대한 연구결과는 상반된 양상을 보여준다. Kosmyna et al.(2025)은 18~39세 성인 54명을 대상으로 ChatGPT 사용이 인지적 노력에 미치는 영향을 분석하기 위해, 도구 없이 인간이 직접 에세이를 작성한 집단, 구글과 같은 검색 엔진을 사용하여 에세이를 작성한 집단, 그리고 LLM의 도움을 받은 집단 간의 뇌파를 비교하였다. 그 결과, 도구 없이 직접 에세이를 작성한 집단이 뇌 연결성이 가장 강하고 넓게 분산되어 있었으며, LLM을 사용한 그룹이 가장 낮은 뇌 연결성을 보였다. 또한 에세이에 대한 창의성, 소유감, 기억력 역시 인간이 직접 글을 작성한 집단에서 가장 높게 나타난 반면, LLM을 사용한 집단은 자신이 작성한 글에 대한 소유감이 낮고 창의성도 떨어지는 경향을 보였다(Kosmyna et al., 2025).
반면, 일부 연구에서는 AI 도구가 오히려 학습을 촉진할 수 있는 가능성에 주목하고 있다. Holzner et al.(2025)은 AI와 관련된 연구 28편을 중심으로 메타분석한 결과, 글쓰기, 연구, 소프트웨어 개발 등 다양한 과업에서 생성형 AI와 협업한 경우, 수행 능력을 향상시킬 수 있었고, 창의적 수행 향상이 보이되 아이디어 다양성이 감소 된다고 보고하였다. 또한 Doshi and Hauser(2024)는 AI가 아이디어 발상 단계에서 창의성을 증진시키는 반면, 다양성은 감소할 수 있다는 점도 실험적으로 확인하였다. 한편 Pellas(2023)는 학부생을 대상으로 한 비교 연구에서, 생성형 AI 플랫폼이 대학생들의 서사적 지능과 글쓰기 자기 효능감을 높이는 데 효과적이라고 보고하였다. 이러한 근거는 AI가 개별 수행 향상에 기여하는 한편, 다양성, 주체성, 인지 참여의 잠재적 약화를 동반할 수 있음을 시사하며, 수업 설계에서 비판적 활용과 사실 검증, 과제 구조의 재설계가 병행되어야 함을 보여준다.
3. 연구 방법
3.1. 연구 대상 및 수업
3.1.1. 수업 개요
본 연구의 분석 대상은 서울 소재 4년제 사립 D대학교에서 학부생을 대상으로 매 학기 개설되는 일반 교양과목 <21세기생명생태철학>이다. D대학교 학부교양대학의 교과목 공모를 통해 2017년 1학기부터 신설되어 현재에 이르고 있는 이 과목은 실용성과 다양성을 중시하는 교양교육의 일환으로, 학문 및 전공 간 경계를 넘어 다양한 분야를 융⋅복합하여 새로운 지식과 가치를 창출하는 것을 목표로 한다. 또한, 이 강좌는 대학의 ESG(지속가능경영) 교육 방침에 따라 환경, 기후과학, 지속가능성 관련 교양과목으로 지정된 총 9개 과목 중 하나로, 환경적 책임을 반영한 교육과정 운영의 일환으로도 기능하고 있다. 3학점, 주당 3시간, 총 15주차로 구성된 이 강좌는 과학혁명과 산업혁명을 거치며 형성된 현대 학문의 흐름을 개괄하고 인지과학, 뇌과학, 생태학, 복잡계과학을 통해 현대 학문의 특징을 알아보는 데 있다. 또한 고대와 근대의 생명관⋅자연관을 비교하며 생태학적 세계관 형성을 모색한다. 수업은 한 학기 동안 ‘현대의 학문세계’, ‘생명철학’, ‘생태철학’의 세 가지 주제로 나뉘어 진행되며, 고대-중세-근대-현대를 아우르는 사유의 변천사를 중심으로 각 주제에 해당하는 개념을 체계적으로 학습한다. 학기 말에는 전체 수업 내용을 종합적으로 고찰할 수 있는 주제에 대해 작문 과제를 제출하도록 하는데, 이 과제는 성적 평가에서 20%의 비중을 차지한다.
3.1.2. 수강생 및 과제 가이드
본 연구는 교양과목 <21세기생명생태철학>을 수강한 학부생들의 학기 말 작문 과제물을 비교 분석 대상으로 삼았다. 본 수업을 듣는 학생들은 주로 1, 2학년에 해당하며 일부 3, 4학년 학생들까지도 수강한다. 최종 분석 대상은 총 69편(21학년도 20개, 25학년도 49개)으로, 연도별 분포와 구성은 <표 1>과 같다. 2025학년도 학생들이 사용한 AI 도구로는 ChatGPT를 가장 많이 사용하였고 Google Gemini, Perplexity 등도 활용되었다. ChatGPT가 보편적으로 사용되지만, Perplexity는 출처를 항상 제공하는 도구이자 자체 LLM뿐만 아니라 Open AI GPT, Claude 3.5 등 외부 모델도 사용되기 때문에 최근 뉴스, 연구, 자료 보고 등이 가능하다. 학생들은 해당 과제 제출을 위해 생성형 AI를 평균 5.98회 정도(최소 3회, 최대 15회)를 사용하였다고 응답하였다.
과제는 수업에서 다룬 현대 학문의 흐름 중 인지과학, 생태학, 뇌과학, 복잡계과학 중 하나를 주제로 선택하여 소논문 형태로 작성하도록 하였다. 글은 서론-본론-결론-참고문헌의 구조를 따르며, 분량은 A4 6매로 제한하였다. 2021학년도와 2025학년도 모두 과제의 주제와 형식은 동일하였으나, 2025학년도에는 생성형 AI 사용에 관한 윤리적 가이드라인과 명시적 지침이 추가로 제시되었다.
교수자는 2025학년도 학기 초 수업 오리엔테이션을 통해 AI 활용 기준 및 윤리를 설명하고, 생성형 AI 사용 원칙과 주의사항을 안내한 과제 작성 가이드 및 체크리스트를 LMS에 상시 게시하였다. 이에 D대학교 교수학습혁신센터가 제작한 「챗GPT 부정사용 사례와 AI 탐지 프로그램 사용법」 카드뉴스 자료 등을 공유하여 AI 사용에 대한 윤리적 인식 제고를 병행하였다. 학생들에게 제시된 주요 지침은 다음과 같았다. ①생성형 AI는 아이디어 탐색이나 자료 요약이 아닌, 문장 구성과 문맥 퇴고의 보조 도구로 한정할 것, ②생성 결과물에 대한 사실 검증과 자기 해석을 반드시 수행할 것, ③과제 말미에 사용한 생성형 AI 도구, 사용 목적, 사용 방식 등을 명확히 기재할 것, ④최종 제출 전 표절검사 프로그램을 통한 유사도 검증 결과를 함께 제출할 것 등이다.
이와 더불어, 평가 기준을 명시적으로 고지하고 과제 성취도를 다음 세 가지 항목을 중심으로 평가하였다. ①수업 내용 이해도(10점): 수업에서 다룬 핵심 개념 및 논점의 정확한 이해, 관련 이론의 적절한 활용 여부, ②독창적 해석(5점): 개념에 대한 비판적 재해석, 현실 적용 능력, 통찰력 있는 관점 제시 여부, ③성실성 및 형식적 완성도(5점): 요구된 분량, 문단 구성, 문법 및 맞춤법 정확성 등 글쓰기의 기본기 준수 여부 등이다.
위와 같은 교육 설계는 단순히 생성형 AI의 활용 여부를 넘어, 학생들이 생성형 AI를 어떻게 인식하고 활용하며 주체적으로 사고하는지를 평가의 핵심 지점으로 설정한 것이다. 이를 위해 교수자는 학생들이 AI에 무비판적으로 의존하기보다, 도구로서 인식하고 비판적⋅창의적으로 활용할 수 있도록 유도하였다.
3.2. 연구방법
본 연구에서는 생성형 AI 도구를 활용한 과제물과 학생들의 과제물 비교를 위해 정량 분석으로 텍스트마이닝을, 정성 분석으로 수업을 진행한 교수자가 과제물의 내용 분석을 병행하였다. 정성적 분석의 객관성과 신뢰성을 확보하기 위해, 본 강좌 담당 교수자 외 교육학박사 1인을 패널로 구성하여 연구 결과를 보완하였다. 두 분석자는 과제물의 내용과 형식을 비교 검토하였다. 텍스트마이닝 분석을 위해 한글로 작성된 소논문 과제물은 워드로 변경하여 데이터화하였고 클라우드 기반의 Google Colab에서 데이터를 분석하였다. Colab으로 과제 데이터를 불러와 pandas, KoNLPy 라이브러리 등을 활용하여 텍스트 길이 분석, TTR(Type-Token Ratio), MATTR(Moving Average Type-Token Ratio), 접속사 부사 및 연결표현의 빈도 및 TTR, 감성 분석을 실행하였고 결과를 시각화하였다.
3.3. 자료 분석
2021학년도 과제물과 2025학년도 과제물은 텍스트마이닝 기법과 교수자 관점의 정성적 분석을 통해 검토하였다. 2025학년도 과제물은 생성형 AI를 활용한 과제물로 간주하였고, 2021학년도 과제물은 학생들 스스로 작성한 과제물로 간주하였다. 이 두 과제의 언어적 특징을 분석하고자 텍스트마이닝 기법으로는 1)문장 길이, 2)어휘 다양성(TTR, MATTR), 3)접속 부사 및 연결표현의 빈도 및 TTR, 4)감정분석을 활용하였다.
첫째, 문장길이 분석은 과제물의 문장 특성을 정량적으로 비교하고자, 각 문서의 평균 문장 길이(글자수)를 산출하여 비교하였고, t-검정을 통해 유의성을 검토하였다. 이때 글의 문장은 ‘다’, ‘요’, 마침표(.), 물음표(?), 느낌표(!), 공백 또는 줄바꿈도 문장 끝으로 판단하여 분석하였다.
둘째, 어휘 다양성 분석은 품사, 명사, 동사, 형용사, 부사를 중심으로 TTR과 MATTR 지수를 구하였다. TTR은 전체 단어 수 중 중복 없이 등장하는 고유 단어수의 비율로, 문서 내에서 중복을 제외한 서로 다른 단어의 개수를 의미한다. 예를 들어 ‘나는 책을 읽고 또 책을 샀다’에서 전체 단어수는 7개, 고유 단어수는 중복한 단어를 제외한 6개로 TTR 값은 6/7(0.857)이다. 그러나 TTR은 텍스트의 길이에 민감한 한계를 가지고 있어 본 연구에서 2021학년도와 2025학년도 문서 수의 차이가 존재하여 TTR 값에 영향을 주기 때문에 이를 보정하기 위한 MATTR도 사용하였다. MATTR은 고정된 윈도우 크기(단어수)를 설정하여 각 구간의 TTR을 계산하여 그 평균값을 의미하며, 본 연구에서 윈도우 크기는 100어절로 설정하였다. 또한 TTR과 MATTR의 t-검정을 통해 통계적 유의성을 검토하였다.
셋째, 접속 부사 및 연결표현 분석은 생성형 AI가 자주 사용하는 연결어의 특성을 살펴보기 위해 비교 분석하였다. 접속사의 의미와 기능은 연구자마다 다르게 두고 있기 때문에(정혜, 2017) 본 연구에서는 정혜(2017)의 분류 체계를 참고하여 순접(예: 그리고, 또한), 역접(예: 그러나, 하지만), 조건(예: 만약, 만일, 혹시), 시간 및 순서(예: 먼저, 다음), 예시 및 강조(예: 예컨대, 특히), 선택(예: 또는, 혹은), 요약 및 정리(예: 즉, 예컨대)에 해당하는 접속 부사 및 연결 표현 50개를 선정하여 빈도와 TTR을 산출하였다. 분석 대상의 어휘는 50개로 고정되었기 때문에 윈도우 크기를 설정에 따른 변동이 거의 없으므로 MATTR 산출은 생략하였다.
넷째, 감성분석은 텍스트에 담긴 감정이나 태도를 분석하고자 실시하였다. 감정분석은 긍정, 부정, 중립과 같은 감성 상태를 분류하고 점수화하는 방법으로 본 연구에서는 KNU 한국어 감성사전(온병원 외, 2018)를 사용하여 감성 상태, 매우 부정(-2), 부정(-1), 중립(0), 긍정(1), 매우 긍정(2)의 리커트 척도에 따라 분류하고 점수화하였다. 각 과제물의 감성점수는 문서별 산출하였고 학년도별 감성 경향의 차이를 분석하였다.
4. 연구결과
4.1. 텍스트마이닝 분석결과
AI를 활용한 글과 인간이 작성한 글의 차이를 정량화하기 위해 텍스트 길이, 어휘 사용, 전체 텍스트 특성 측면에서 이들 간의 차이를 확인하고자 비교 분석하였다.
4.1.1. 문장 길이 비교
<표 2>와 같이 2021학년도 학생들이 스스로 작성한 소논문 형식의 글은 문서당 평균 82.06개 문장, 문장당 평균 54.20글자로 나타났다. 반면, 2025학년도 AI 활용 글은 문서당 평균 114.85개 문장, 문장당 평균 48.69글자로 이루어졌다. 문장을 이루는 글자 수의 차이를 t-검정으로 분석할 결과, 통계적으로 유의하였다(t=4.874, p=.00). 이는 AI 활용 글에서 문장 분절이 더 빈번하게 발생하여 문장 수는 많아지고 평균 문장 길이는 짧아졌음을 시사한다. 다시 말해, AI 활용 글은 상대적으로 더 짧고 간결한 문장으로 구성되는 경향이 있던 반면, 인간이 작성한 글은 문장 길이가 더 긴 양상을 보였다.
4.1.2. 어휘의 다양성
어휘 다양성은 TTR을 사용해 평가하였으며, 문장에서 의미를 부여하는 주요 정보어로는 명사, 동사, 형용사, 부사를 선정하였고 그 외 조사, 전치사 등은 제외하였다. 2021학년도 인간이 작성한 20개 문서에서 사용된 주요 정보어(명사, 동사, 형용사, 부사)의 총합은 전체 29,987개이며, 이중 고유 정보어수 5,125개이다. 반면, 2025학년도 AI를 활용한 49개 문서에서 사용된 주요 정보어 총합은 90,459개이며 이중 고유 정보어는 7,660개였다. 정보어 TTR은 2021학년도 0.518, 2025년 0.427로, 인간이 작성한 글에서 고유 정보어가 더 다양하게 사용되었다. 이때 인간의 글과 AI 활용 글의 TTR 차이는 유의미하였다(t=6.204, p<.001). 또한 품사, 명사, 동사, 형용사, 부사 각 품사에서 2021학년도 인간 글과 AI 활용 글의 TTR은 상이하였으며 유의미한 차이로 나타났다. 품사별 구체적인 점수는 <표 3>과 [그림 1]과 같다.
문장 길이와 문서 분량의 차이를 보정하기 위해 품사별 정보어의 MATTR을 추가로 산출한 결과 역시 유사하였다. 정보어 MATTR은 2021학년도 0.562, 2025학년도 0.562로 인간이 작성한 글에서 어휘 다양성이 더 높게 나타났다(t=5.384, p<.001). 품사별로 살펴보면, 명사 MATTR에서는 두 집단 간 유의미한 차이가 뚜렷하지 않았으나, 동사, 형용사, 부사에서는 2021학년도 인간의 글의 MATTR 값이 2025학년도 AI 활용 글보다 더 컸다.
4.1.3. 접속부사 및 연결표현의 빈도 및 다양성
접속 부사 및 연결표현 50개를 지정하여 분석한 결과는 <표 4>와 같이 2021년 인간이 작성한 20개 문서에서는 총 488회 사용되었고, TTR은 0.484였던 반면, 2025년 AI를 활용한 49개 문서에서는 총 1,495회 사용되었고, TTR은 0.432로 나타났다. 그러나 TTR의 차이는 통계적으로 유의하지 않았다(t=1.652, p=.106).
다만, 상위 20개 접속 부사 및 연결표현을 비교하면 <표 5>와 같이, 2021학년도에는 ‘한다면’, ‘~라면’ 등의 조건 유형이 상위에 포함되었으나, 2025학년도 AI 활용 글에서는 포함되지 않았다. 또한 AI 활용 글에서는 ‘예를 들어’, ‘사실은’, ‘예컨대’, ‘다시 말해’ 등 예시 및 강조 유형의 접속 부사 및 연결표현이 상대적으로 높게 나타났다.
4.1.4. 감정분석
감성분석은 텍스트에 담긴 감정(긍정, 부정, 중립)을 분류, 점수화하는 방법으로, 본 연구에서는 매우 부정(-2), 부정(-1), 중립(0), 긍정(+1), 매우 긍정(+2)의 5점 리커트 척도를 적용하였다. 문서별 감성 점수를 산출한 뒤 학년도별 경향을 비교한 결과는 <표 6>과 같다. 2021학년도는 평균 0.028점, 2025학년도는 0.080로 평균 차이는 크지 않았고, 통계적으로도 유의하지 않았다(t=-1.209). 즉 학생이 직접 쓴 글과 AI 활용 글 사이의 전반적인 감성 성향 차이는 나타나지 않았다. 이는 과제의 성격상 과학 글쓰기의 중립적 문장이 다수를 차지했기 때문으로 해석된다.
4.2. 교수자 관점의 분석 결과
<21세기생명생태철학> 교과목을 직접 운영한 교수자의 관점에서, 주요 분석 관찰은 다음과 같은 다섯 가지 항목으로 정리할 수 있다.
첫째, 과제 가이드라인 준수도 및 작성 태도의 변화이다. 2025년 과제에서는 AI 활용에 관한 구체적인 가이드라인(예: “생성형 AI는 문장⋅문맥 퇴고를 위한 보조적 수단으로 활용할 것”)이 LMS 시스템 및 수업을 통해 반복적으로 안내되었음에도 불구하고, 다수의 학생이 본인의 사고나 논지를 주도적으로 구성하기보다는 AI의 응답을 중심으로 과제를 작성한 정황이 관찰되었다. 이러한 양상은 <표 7>과 같이 문장이 완성되지 않은 개조식 및 단어 형태로 글을 서술하는 모습은, AI가 생성한 결과를 본인의 글, 문장으로 다듬어 문맥과 문장을 만들기보다는 필요한 바를 AI를 통해 그대로 인용했음을 볼 수 있다. 이 때문인지 과제물들의 문장 구성이나 문법적 매끄러움에서는 대체적으로 향상된 결과를 볼 수 있었다. 다른 한편으로는 개별 학생의 고유한 사유나 관점은 상대적으로 약화되었고, 전체적으로 사고의 획일화 및 문체의 비슷함이 두드러졌다.
둘째, 문장 구성 및 표현 방식의 변화이다. 2021년도 과제에 비하여 2025년 과제에서는 서술형 문장보다 단문 나열이나 요약적 진술 같은 개조식 문장의 사용 비율이 현저히 높아졌다. Ⅰ → 1→ 1) → (1) → ① 등과 같이 세분화하여 구조화하는 경향이 전반적으로 두드러졌다. 이는 AI가 생성하는 문체의 일반적 특성과 관련이 있을 가능성이 있다. 이러한 구성 방식은 독해의 명료성을 높이는 장점이 있지만, 학문적 글쓰기에서 요구되는 심화된 논리 전개나 문장 간 유기적 연결성이 약화되는 한계도 함께 보여주었다. <표 7>의 사례와 같이 2021학년도에는 글을 중심으로 내용을 정리하고 자신의 논지를 밝히는 글의 유형이 다수였지만 2025학년도 과제에서는 하나의 챕터 안에서도 소주제를 나누고 이에 대한 요약적인 진술과 개조식 문장이 많이 보여졌다. 글의 구조적 측면에서는 세밀화하여 정리하고 명료성을 높이는 양상으로 볼 수도 있겠지만 관련된 글에 대한 학생 스스로의 입장과 주장을 찾아보기는 어려웠다.
셋째, 참고문헌의 활용과 인용 양상에서도 주목할 만한 특징이 <표 8>과 같이 나타났다. 2025학년도 과제에서는 영어권 문헌의 인용이 빈번하게 등장하였다. 2021학년도 제출 과제 22편 중 영어권 자료를 참고문헌으로 제시한 경우는 2편에 불과했으나, 2025학년도 과제의 경우 50편 중 20편으로 그 비율이 크게 증가하였다. 학부 수준의 교양 수업에서 해외 자료를 직접 참고하는 사례가 드문 점을 고려할 때, 이러한 변화에는 AI의 참고문헌 추천 기능이 일정한 영향을 미친 것으로 보인다. 한편, 존재하지 않는 논문이나 단행본이 인용된 사례도 다수 확인되었다. 특히, 2018년에 별세한 인지과학자 이정모의 연구 논문 출판 시기를 2022년으로 제시하거나, 그의 대표 저서 『인지과학』 대신 존재하지 않는 도서명인 『인지과학개론』을 참고문헌으로 기재한 사례가 여러 과제에서 동시에 확인되었다. 이는 AI의 환각(hallucination) 현상이 과제물에 직접적으로 반영된 것으로, 학생들이 AI가 제시한 참고문헌 정보를 비판적으로 검토하지 않은 채 그대로 활용한 결과로 해석된다. 이처럼 복수의 학생이 동일하거나 유사한 문헌을 인용한 것뿐 아니라, 서술 구조가 거의 일치하는 과제물도 확인되어 GPT 활용에 따른 내용 중복 및 신뢰성 문제가 드러났다.
넷째, 표절 검사와 유사도율 간의 불일치 문제이다. 2025학년도 과제에서는 사전에 공지된 표절 검사 기준(6어절 이상 일치, 1문장 이상 일치)에 따라, 학생들이 학교에서 제공하는 표절 검사기를 통해 직접 유사도율을 확인하고 10% 이하로 판정받은 과제물을 그 결과 수치와 함께 제출하도록 하였다. 기존 발행 문서와 학생 과제물의 유사성을 검토하는 경우, 구체적인 일치 지점을 제시할 수 있어 논란의 여지가 비교적 적다. 반면, 생성형 AI가 작성한 문서를 판별하는 과정은 객관적 근거를 제시하기 어려워 판단의 신뢰성을 확보하기 어렵다. 따라서 본 연구에서는 GPT Killer, GPT Zero 등 AI 문서 판별 도구를 활용한 검증 절차는 제외하였다. 교수자가 추가로 실시한 표절 검사의 결과, 대부분 과제물에서 제출한 수치보다 높은 유사도율이 확인되었다. 평균 유사도율은 15%였으며, 제출 과제 중 최고 유사도율인 47% 판정이 나온 학생조차 본인이 기록한 수치는 7%에 불과했다. 이러한 결과는 학생들이 검사 시스템 사용에 미숙했거나, 결과 수치를 조작하여 제출했을 가능성을 시사한다.
다섯째, 드물지만 AI 도구의 모범적 활용 사례도 확인되었다. 대다수 과제에서 AI에 대한 무비판적 의존이 보였지만, 일부 학생들은 AI를 도구적 수단으로 인식하고 이를 주체적으로 활용하는 모습을 보였다. 예를 들어, “이 과제물의 문헌 조사를 위해 DBpia의 AI 검색 기능을 활용함”, “챗지피티 3.5(2025/6/6): 기후 협약에 대해서 뭐가 있을지 알려달라는 요청에 파리협약을 알게 됨” 등과 같은 구체적 활용 방식을 명시한 경우가 있었다. 이는 AI의 기능을 비판적으로 수용하고, 자신의 사고와 목적에 따라 이를 통제할 수 있는 능력으로 평가할 수 있다. 이러한 사례는 생성형 AI와 인간 사고의 협력적 관계가 가능함을 보여주는 동시에, 향후 교육적 지도 방향 설정에 중요한 시사점을 제공한다.
5. 결론 및 논의
본 연구는 생성형 AI를 활용한 글과 인간이 작성한 글을 비교하여 AI 활용 글의 특징을 살펴보고, 고등교육의 보고서 및 에세이 중심 수업에서 교수자가 유의할 점을 제안하고자 하였다. 이를 위해 AI를 활용한 과제물과 학생들 스스로 작업한 과제물을 텍스트마이닝과 교수자 관점에서 분석한 결과는 다음과 같다.
첫째, 문서 내 문장 수와 글자 길이를 분석한 결과, AI 활용을 받은 소논문 형식의 글은 평균 114.85개 문장, 문장당 평균 48.69글자로 이루어졌다. 오롯이 학생들 스스로 작성한 인간의 글은 평균 82.06개 문장, 한 문장당 평균 54.20글자가 사용되어, 이들 집단의 문장 길이의 차이는 통계적으로 유의하였다(t=4.874, p<.001). 즉 AI 활용 글은 문장 수가 많고 각 문장이 더 짧아 상대적으로 간결한 서술 경향을 보였던 반면, 인간 작성 글은 더 긴 문장으로 구성되었다. 둘째, 어휘의 다양성을 확인하고자 의미 부하가 큰 정보어, 명사, 동사, 형용사, 부사만을 분석 대상으로 선정하여 TTR과 MATTR 값을 집단 간 비교하였다. 2021학년도 인간 작성 글의 고유 정보어는 5,125개, TTR 0.518, MATTR 0.629였던 반면, 2025학년도 AI 활용 글의 고유 정보어는 7,660개, TTR 0.427, MATTR 0.562였다. 즉, 인간 작성 글이 AI 활용 글보다 더 폭넓고 다양한 어휘를 사용하였다는 점이 확인되었다(TTR: t=6.204, p<.001; MATTR: t=5.384, p<.001). 셋째, 접속 부사 및 연결표현 50개를 지정하여 빈도와 다양성을 분석한 결과, 인간 작성 글과 AI 활용 글의 전체 빈도와 다양성 차이는 통계적으로 유의하지 않았다(t=1.652, p=.106). 다만 상위 20개 접속사를 비교한 결과, 2025학년도 AI 활용 글에는 예시 및 강조형(예: 예컨대, 다시 말해 등) 접속 부사가 상대적으로 자주 사용되었고, 인간의 글에는 조건 유형(예: 한다면, 라면)이 상위에 포함되었다. 넷째, 텍스트의 감정분석 결과, 과제 특성상 중립 문장 비중이 높아 감정 점수의 집단 간 평균 차이는 작고 통계적으로 유의하지 않았다. 다섯째, 교수자의 관점에서 AI 활용 글에서는 학생 고유의 사유나 관점의 약화, 사고의 획일화, 영어권 문헌 인용 증가, 존재하지 않는 참고문헌 인용 및 검증되지 않은 인용, 표절 및 유사도 검사 결과의 불일치 등이 문제점으로 확인되었다. 특히 AI 활용 글에서는 단문 나열과 요약적 진술 중심의 개조식 문장이 빈번하게 드러났다.
이상의 결과를 종합하면 AI 활용 글의 특징은 다음과 같이 정리할 수 있다. 첫째, AI 활용 글은 짧고 간결하며, 단문 나열이나 요약적 진술 중심으로 전개가 단순화되는 경향이 있다. 이는 Emara(2025) 연구 결과와 일치한다. 다만 어휘의 다양성은 언어의 숙련도, 장르, 프롬프트의 품질, 자료 제공의 충실성 등에 좌우될 수 있다. 본 연구의 한국어 과학 글쓰기 과제에서는 인간이 작성한 글에서 어휘의 다양성이 높았으나, 아랍어 및 츠와나어 ESL 학습자를 대상으로 한 연구 Emara(2025)와 Zindela(2023)에서는 AI 활용 글이 더 다양한 어휘와 정교한 표현을 보였다. 학습자의 언어 수준이 다양하게 존재하며 프롬프트를 어떻게 활용하는지에 따라 결과가 다르게 나타날 수 있기에, 어휘의 다양성을 더 이상 인간 고유의 지표로 보기 어렵다는 점을 시사한다. 둘째, AI 활용 글은 접속 부사의 사용 빈도에서 인간 작성 글과 차이는 유의미하지 않았으나, AI 활용 글에서 예시 및 강조형의 접속 부사가 상대적으로 많이 등장하였고, 인간 글에서는 조건 유형의 접속 부사가 상대적으로 많이 등장하였다. 이는 AI는 주제를 설명하고 논리를 뒷받침하기 위해 구체적인 예시를 드는 방식을 보여주는 특징과, 인간은 좀 더 특정 상황을 전제로 논리를 전개하거나 다양한 상황을 고려하여 복잡한 논리를 구성하는 특징으로 해석할 수 있다. 이러한 결과는 교수자 관점의 정성적 평가에서도 사고의 획일화로 지적되었던 부분과 일치한다.
한편, AI 활용 글에서는 AI의 무비판적인 활용에 따른 문제점이 확인되었다. 존재하지 않는 참고문헌 인용, AI 사용 사실 미언급 등은 학생들이 AI가 작성한 글을 검증 없이 그대로 제출한 사례로, AI 도구의 사용을 단순히 제한하는 것이 실질적인 해결책이 되기 어렵다는 것을 시사한다. AI는 이미 인간 고유의 표현, 어휘력, 창의적 서술 능력까지 모방할 수 있는 수준에 이르렀다. 따라서 그 사용 자체를 비난하기보다 ‘어떻게’ 활용할 것인가에 대한 교육적 접근이 요구된다(권태현, 2023; 나은미, 2024). 교육 현장에서 AI를 단순히 어휘 및 문장 교정, 주제 요약, 데이터 분석, 코드 생성, 번역 등의 결과물 산출 도구로만 활용하는 데 그치지 않고, 프롬프트 수정 과정의 제출, 출처 검증 절차의 기록, 반성적 메모와 자기 점검 등 학습 과정을 증거화하는 과정 중심 평가를 도입하는 것도 하나의 방법이다.
또한 과제마다 AI 기여도와 사용 범위를 명확하고 일관된 형식으로 투명하게 공개하도록 필수화할 필요가 있다. 이는 학습자가 AI를 수동적으로 수용하는 수준을 넘어 능동적, 비판적 활용 능력을 강화하는 데 필수적인 요소이다(안예림, 2024). 이러한 과정들은 AI를 과제물 또는 성과 산출을 위한 단순 도구가 아니라 학습 파트너이자 보조 학습자로 위치시키려는 시도로 궁극적으로는 학습자가 AI를 비판적으로 활용하되 최종 판단과 책임은 인간에게 있다는 원칙을 분명히 하는 인간 중심의 AI와도 직결된다.
Li(2025)는 AI가 교육에서 인간의 역할을 지배하는 위험, 과도한 의존을 방지하기 위한 교육학적 전략으로 인간의 비판적 사고와 능동적 참여를 강조하였다. AI 도구에 수동적으로 의존한다면 비판적 사고 능력과 기본적인 작문 능력이 저하될 수 있기 때문에, AI를 활용하는 교육과정에는 생성한 결과물에 대해 정확성, 잠재적 편향, 학술적 관련성, 깊이가 있는지 등을 평가하고 높은 수준의 사고를 이끌 수 있는 설계가 필요하다는 것이다. 그리고 AI를 효과적으로 활용하기 위해서는 능동적 참여와 적극적 상호작용이 필요하다고 보았으며, 이를 위해 프롬프트 과정의 중요성이 부각 된다. 생성형 AI의 결과물은 사용자가 제시하는 프롬프트에 크게 영향을 받기 때문에, 사용자는 정교하고 구체적인 명령을 구성하고 생성형 AI와의 반복적 상호작용을 통해 결과물을 완성해 나가야 한다고 보는 것이다(Li, 2025). 생성형 AI 시대에는 이러한 교육적 전략과 교수설계의 재구성이 전제되어야 AI 기술의 이점을 활용할 수 있으며, 동시에 AI에 대한 과도한 의존과 편향을 방지할 수 있겠다.
더불어 본 연구는 다음과 같은 한계를 가진다. 첫째, 2021학년도 과제물은 본 연구를 전제로 수집된 자료가 아니었으므로, 연구 설계 차원에서 동일한 조건으로 완벽히 통제하기 어려웠다. 둘째, 해당 강좌의 주요 주제가 디지털 리터러시가 아니었기에, 학생들이 과제 작성 과정에서 AI 활용을 어느 정도 비중 있게 고려했는지 정밀하게 측정하는 데 제약이 있었다. 이러한 한계는 AI 활용에 대한 학습자의 동기, 태도, 실제 사용 맥락을 충분히 반영하지 못했을 가능성을 내포한다.
이러한 제약을 보완하기 위해 향후 연구에서는 AI 글쓰기 활용을 핵심 주제로 설정한 교과목과 그렇지 않은 교과목을 비교하는 연구, 동일 학습자를 대상으로 AI를 활용한 글쓰기와 비활용 글쓰기를 반복 측정하는 연구, 교수자⋅학습자 인터뷰, 수업 관찰, 과제 수행 과정 분석 등을 포함한 질적 연구를 병행할 필요가 있다. 예를 들어, 김지오, 남진숙(2023) D대학교의 교양필수과목인 <디지털시대의 글쓰기> 이수 집단과 비이수 집단 간 작문 특성을 비교하거나, 학생들이 사용한 AI 도구의 종류⋅기능별 차이를 분석하는 것도 의미 있는 연구 방향이 될 수 있다. 더 나아가 개별 교양과목 단위의 대응을 넘어, 대학 차원에서 교육과정과 교과목 구조를 AI 시대에 맞게 재설계하는 장기적 접근 역시 요구된다. AI가 수업에 도입되었다고 하여 교수자와 학습자의 인식과 행동이 자동으로 변화하지는 않기 때문에, 단순한 기술 도입을 넘어 교육 현장의 맥락 속에서 AI 활용의 올바른 방향을 모색하는 지속적인 논의가 필요할 것이다. 본 연구가 이러한 논의에 기초 자료와 통찰을 제공하기를 기대하며 미진한 부분은 향후 연구에서 보완하고자 한다.