AI 시대 새로운 시험 부정행위 사례와 해결 방안
AI 시대, 새로운 부정 행위의 등장으로 기존 시험 방식의 공정성과 신뢰성에 위기가 다가왔습니다. 한국 대학에서 일어난 AI 시험 부정행위 4가지 사례와 세 가지 해결 방법을 정리했습니다.
May 13, 2026
AI가 빠르게 일상으로 들어오면서, 시험을 둘러싼 풍경도 함께 바뀌고 있습니다.
예전에는 시험 부정행위라고 하면 종이 컨닝페이퍼나 옆자리 답안 베끼기가 먼저 떠올랐어요. 온라인 시험이 늘어난 뒤에는 화면 공유, 메신저 답안 공유, 대리 응시 같은 문제가 커졌고요. 그리고 이제는 여기에 생성형 AI까지 더해졌습니다.
학생이 카메라 앞에 앉아 있고, 시험 화면도 정상적으로 띄워져 있습니다. 겉으로 보기에는 아무 문제가 없어 보입니다. 하지만 보이지 않는 곳에 ChatGPT를 켜두었다면 어떨까요?
2025년 들어 국내 대학에서는 실제로 ChatGPT를 활용한 시험 부정행위가 잇따라 적발됐어요. 서울대, 연세대, 고려대 같은 주요 대학도 예외는 아니었어요.
이번 글에서는 최근 한국 대학에서 벌어진 ChatGPT 시험 부정행위 사례를 살펴보고, AI 시대에 어떤 방식으로 시험을 다시 설계해야 하는지 정리해 볼게요.
2025년 대학에서 일어난 시험 부정행위 사례
1) 연세대학교 — 600명 비대면 시험에서 40명 자수
2025년 11월, 연세대학교 교양과목 ‘자연어 처리와 챗GPT’ 중간고사에서 부정행위 의심 사례가 발생했습니다.
당시 응시생은 약 600명. 학교는 학생들에게 화면과 얼굴이 모두 보이도록 영상을 촬영해 제출하게 했습니다.
그럼에도 감독관이 의심한 50명 가운데 40명이 부정행위를 자수했습니다.
학생들은 카메라가 비추지 않는 위치에 두 번째 모니터를 두고 ChatGPT를 띄워두거나, 디스코드로 외부 사람과 대화하며 답을 받은 것으로 알려졌습니다.
이 사례가 보여주는 것은 분명해요.
단순히 카메라를 키고, 화면을 녹화하는 것만으로는 충분하지 않다는 점입니다. 카메라가 보지 못하는 사각지대가 존재하고, 녹화되고 있는 화면 외에 다른 모니터가 기기를 사용할 수도 있어요.
2) 고려대학교 — 카카오톡 오픈채팅 1,400명 답안 공유
고려대학교 일부 강의에서는 약 1,400명이 모여 있는 카카오톡 오픈채팅방에서 시험 답안을 공유한 것이 적발됐습니다.
이 사례는 AI 이전부터 이어져 온 온라인 시험 부정행위의 모습입니다. 시험 답안을 공유하거나, 시험 중 실시간으로 정보를 주고받는 방식이에요. 문제는 이런 방식이 AI와 결합하면 훨씬 더 복잡해진다는 데 있어요.
학생끼리 답을 공유하는 데서 그치지 않고, AI가 답안을 생성해 주고, 그 답안이 다시 단체방을 통해 빠르게 퍼질 수 있습니다. 부정행위의 속도와 규모가 동시에 커지는 셈입니다.
3) 서울대학교 — 기말고사 36명 조사, 일부 답안 무효 처리
서울대학교는 2025년 1학기 기말고사에서 ChatGPT 사용이 의심된 학생 36명을 조사했습니다. 그중 일부 학생의 답안은 무효 처리됐고, 학칙에 따른 징계 절차도 이어졌습니다.
여기서 중요한 점은 ChatGPT 사용 여부를 판단하기 어렵다는 것입니다.
AI가 만든 답안은 점점 자연스러워지고 있고, 학생이 일부 수정하면 더더욱 구분하기 어려워집니다. 결국 평가자 입장에서는 “이 답안이 AI로 작성된 것 같다”는 추정만으로는 충분하지 않습니다. 언제, 어떤 상황에서, 어떤 행동이 있었는지를 설명할 수 있는 기록이 필요합니다.
4) 서울대학교 통계학 실험 — 대면 시험에서도 AI 코드 발견
AI 부정행위는 비대면 시험에서만 일어나는 문제가 아닙니다.
서울대학교 ‘통계학 실험’ 대면 시험에서도 응시생 30여 명의 답안에서 AI가 생성한 것으로 보이는 코드 패턴이 발견됐습니다. 이 사례는 대면 시험이라고 해서 무조건 안전한 것은 아니라는 점을 보여줍니다.
특히 코딩, 통계, 데이터 분석처럼 노트북이나 태블릿 사용이 허용되는 과목에서는 학생이 시험 중 AI 도구를 함께 사용할 가능성이 있습니다.
부정행위는 사라진 것이 아니라, 쌓이고 있습니다

ChatGPT 같은 AI 때문에 시험 부정행위가 처음 생긴 것은 아닙니다. 부정행위는 늘 시험 방식과 기술 환경에 맞춰 형태를 바꿔 왔습니다.
- 1세대 — 컨닝페이퍼·대리시험 종이 메모, 옆자리 답안 베끼기, 대리 응시
- 2세대 — 메신저·화면 공유 온라인 시험 중 카카오톡, 디스코드, 화면 캡처, 원격 제어 활용
- 3세대 — 생성형 AI ChatGPT, Claude, Gemini 등을 활용해 답안이나 코드를 직접 생성
문제는 새 방식이 등장한다고 해서 이전 방식이 사라지지 않는다는 점입니다.
컨닝페이퍼 작성, 답안 공유는 여전히 일어나는 부정행위예요. 여기에 생성형 AI가 더해지면서 학교가 살펴야 할 범위가 훨씬 넓어졌습니다. 이전에는 “학생이 외부 자료를 봤는가”를 확인하면 됐다면, 이제는 점점 복잡해지고 있습니다.
시험의 공정성이 흔들리면?
부정행위가 반복되면 가장 먼저 흔들리는 것은 정직하게 공부한 학생들의 신뢰입니다.
누군가는 밤새 공부했는데, 누군가는 ChatGPT로 답을 만들어 같은 점수를 받는다고 느낀다면 어떨까요?
학생들은 자연스럽게 이런 질문을 하게 됩니다.
“그럼 나도 AI를 써야 하나?”
“기존 방식대로 준비하는 게 손해 아닌가?”
“이 점수가 정말 실력을 반영하는 게 맞나?”
이런 의문이 쌓이다 보면, 시험은 더 이상 학습을 확인하고 평가하는 장치가 되기 어렵습니다. 시험의 목적은 학생을 의심하는 데 있지 않습니다. 학생이 무엇을 알고, 어떤 부분을 더 배워야 하는지 확인하는 데 있습니다.
그런데 부정행위 가능성이 커질수록 시험은 학습 진단보다 감시와 의심으로 본질이 바뀌게 됩니다.
평가자 입장에서도 어려움은 커집니다. 부정행위를 방치할 수는 없지만, 모든 학생을 잠재적 부정행위자로 대할 수도 없습니다. 결국 필요한 것은 더 강한 통제가 아니라, 더 명확한 기준과 더 객관적인 기록입니다.
기술의 발전과 기준의 부재
한국직업능력연구원이 2024년 대학생 726명을 대상으로 조사한 결과, 학생들의 AI 활용은 이미 일상이었습니다.
- 과제·프로젝트 자료 검색에 AI를 써본 학생: 91.7%
- 글쓰기 과제에 AI를 써본 학생: 77.8%
출처: 한국직업능력연구원 2024 대학생 AI 이용 실태 설문
2026년 5월에 접어든 지금은 거의 모든 학생들이 이미 AI를 학습 도구로 사용하고 있을 것으로 보입니다. 그런데 전국 대학의 77%는 아직 AI 활용 가이드라인을 마련하지 못한 상태입니다.
한국대학신문, 「AI 부정행위 속출하는데 韓대학 77% ‘AI 가이드 없다’」
이 간극이 지금 시험의 가장 큰 문제입니다.
학생들 손에는 이미 AI가 들려 있습니다. 하지만 교육 현장에서는 아직 “어디까지 허용할 것인가”, “무엇을 부정행위로 볼 것인가”, “AI를 활용한 능력은 어떻게 평가할 것인가”를 충분히 정하지 못했습니다.
AI 사용을 전면 금지하면, 시대에 뒤처지게 됩니다. 반대로 아무 기준 없이 허용하면, 시험의 공정성이 무너질 수 있습니다. 이 딜레마를 어떻게 해결할 수 있을까요?
바로 시행 가능한 해결 방법 세 가지
1️⃣ 시험 종류에 따라 AI 정책을 다르게 둡니다
모든 시험에 하나의 기준을 적용할 필요는 없습니다.
어떤 시험은 AI를 철저히 막아야 합니다. 기본 개념을 학생이 스스로 이해했는지 확인해야 하기 때문입니다. 반대로 어떤 시험은 AI 사용을 허용할 수 있습니다. 실제 업무 환경에서는 AI를 포함한 여러 도구를 활용해 문제를 해결하는 능력이 중요하기 때문입니다.
이에 시험을 세 가지 유형 정도로 나누어 볼 수 있습니다.
- Closed-book 시험 외부 자료와 AI 사용을 모두 제한하고, 학생의 기본 이해도를 평가하는 시험
- 오픈북 시험 일부 자료나 검색을 참고하는 것은 허용하되, AI 활용은 제한하는 시험
- AI 허용 시험 AI를 도구로 활용하는 시험 (문제 해결 과정과 판단 능력을 함께 평가할 수도 있음)
핵심은 “AI 활용 여부”만 따지는 것이 아닙니다.
이 시험에서 학생에게 기대하는 능력이 무엇인지 먼저 정해야 합니다. 그리고 그 목적에 맞춰 허용 범위와 금지 범위를 분명히 안내해야 합니다.
교육부와 시·도교육청도 2025년 발표한 수행평가 AI 활용 관리 방안에서 AI 활용을 일률적으로 금지하기보다는 안전하고 교육적으로 활용하는 방향을 강조했습니다.
출처: 교육부, 「수행평가 시 인공지능(AI) 활용 관리 방안」(2025)
교육 현장에서도 전환이 필요합니다. 무조건 막는 방식에서 벗어나, 시험 목적에 따라 AI 사용 기준을 다르게 설계해야 합니다.
2️⃣ 감이 아닌 기록으로 설명합니다
부정행위 판정을 감독관의 직관에만 맡기면 모두가 힘들어집니다. 학생 입장에서는 억울함을 설명하기 어렵습니다. 감독관 입장에서도 확실한 근거 없이 판단을 내리기 부담스럽습니다. 학교 입장에서는 이의 제기와 민원 대응이 어려워집니다.
그래서 필요한 것이 기록 기반 감독입니다. 시험 중 어느 시점에 어떤 일이 있었는지 남겨야 합니다.
기록 예시
- 탭 이탈
- 시선이 반복적으로 화면 밖으로 벗어남
- 복사·붙여넣기 시도
- 화면 공유나 원격 제어 시도
- 두 번째 모니터 연결 여부
- 네트워크 이탈 후 재접속
이런 기록이 영상과 로그로 남으면, 객관적으로 부정행위를 판단할 수 있습니다. 누구나 납득할 수 있는 근거를 남길 수 있습니다. 공정성은 설명 가능한 기록이 있을 때 만들어집니다.
3️⃣ 평가와 다음 학습을 연결합니다
학생이 몇 점을 받았는지도 중요하지만, 더 중요한 것은 진단과 평가를 다음 학습으로 이어가는 것입니다.
어떤 개념을 잘 이해했고, 어떤 것을 반복적으로 틀렸고, 어떤 부분이 부족한지 알려줄 수 있다면 시험은 단순한 평가를 넘어 학습의 출발점이 됩니다.
앞으로의 시험은 단순히 “맞았다/틀렸다”를 판단하는 데서 끝나지 않아야 합니다. 시험 결과가 정리되고, 교사는 그 데이터를 바탕으로 다음 수업을 설계할 수 있어야 합니다. 학생은 자신의 약점을 확인하고 다시 학습할 수 있어야 합니다. 교육부가 AI 서술·논술형 평가시스템을 시범 운영하고, 2026년부터 확대하려는 흐름도 이와 맞닿아 있습니다.
평가는 앞으로 점점 더 진단에 가까워질 것입니다. 좋은 시험은 학생을 걸러내는 장치가 아니라, 다음 배움을 더 정확하게 안내하는 신호가 되어야 합니다.
세 가지 방법을 모두 담은 아케오 Exam

악어에듀의 아케오 Exam은 앞서 이야기한 세 가지 원칙을 바탕으로 만들어졌습니다. 시험 설계부터 공정한 평가, 결과 공유까지, 시험 전 과정을 더 명확하고 공정하게 운영할 수 있게 해줍니다. 대학 프로그래밍 중간고사, 고등학교 정보 수행평가, 자격증·기업 인증 시험 등 다양한 환경에 활용할 수 있습니다.
무엇을 평가할 것인가?
ChatGPT가 시험에 던진 질문은 단순히 “어떻게 막을까?”가 아닙니다. 더 본질적인 질문은 이것입니다.
“앞으로 무엇을 평가해야 하는가?”
각 시험의 목적이 다르다면, 운영 방식도 달라져야 합니다.
AI 시대의 시험은 더 이상 한 가지 방식으로 공정해지기 어렵습니다. 기준은 더 명확해야 하고, 기록은 더 객관적이어야 하며, 결과는 다음 학습으로 이어져야 합니다.
학생을 의심하기 위해서가 아닙니다. 정직하게 공부한 학생이 손해 보지 않도록, 납득 가능한 기준으로 판단할 수 있도록, 시험의 신뢰를 지킬 수 있도록 하기 위해서입니다.
Share article