AI & LLM/프롬프트 엔지니어링

Chain of Thought 프롬프트 한국어 템플릿 8선

Lumin 2026. 5. 18. 20:27
반응형
TL;DR
Chain of Thought(CoT) 프롬프트는 AI에게 "생각하는 과정을 단계별로 적어가며 답하라"고 요청하는 방식입니다. 같은 모델이라도 정답률이 눈에 띄게 올라갑니다. 이 글에서는 한국어로 바로 복붙해 쓸 수 있는 템플릿 8개를 시나리오별로 정리합니다. 읽는 데 약 8분.

ChatGPT나 Claude에게 좀 까다로운 질문을 던졌을 때, 답이 그럴듯해 보이는데 자세히 보면 틀려있는 경우가 종종 있습니다. 특히 계산, 논리 추론, 여러 조건이 얽힌 의사결정 같은 작업에서요. 이때 한 줄만 추가해도 정확도가 확 올라가는 기법이 있는데, 그게 바로 Chain of Thought 프롬프트입니다. 이 글은 CoT가 뭔지 가볍게 짚고, 실제로 복사해서 쓸 수 있는 한국어 템플릿 8개를 시나리오별로 모아둔 자료입니다. 코딩 지식 없어도 읽을 수 있게 썼으니 부담 없이 따라오시면 됩니다.

Chain of Thought가 뭐길래

Chain of Thought 프롬프트는 AI에게 최종 답만 요구하지 않고, 답에 도달하는 사고 과정을 단계별로 풀어 쓰게 만드는 지시 방식입니다. 우리말로는 보통 "생각의 사슬"이라고 옮깁니다.

원리는 의외로 간단합니다. 사람도 어려운 문제를 머릿속으로만 풀려고 하면 실수하지만, 종이에 한 줄씩 적어가며 풀면 정확해지죠. AI도 비슷합니다. "곧장 답해" 대신 "단계별로 추론해서 답해"라고 시키면, 모델이 중간 추론을 출력하면서 그 결과를 기반으로 다음 단계를 만들기 때문에 오답률이 줄어듭니다.

구글 리서치팀이 2022년 발표한 논문(Wei et al., "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models")에서 이 효과가 처음 정량적으로 보고됐고, 이후 거의 모든 LLM에서 비슷한 경향이 확인되고 있습니다. 수학 문제 벤치마크(GSM8K) 기준으로, 동일한 모델에 CoT 프롬프트를 적용했을 때 정답률이 두 배 이상 오른 사례도 있을 정도입니다.

💡 GPT-4, Claude, Gemini 같은 최신 모델은 이미 내부적으로 일부 추론을 수행합니다. 그래도 명시적으로 CoT를 요청하면 더 안정적인 답을 받을 수 있습니다.

CoT가 효과적일 때 vs 굳이 필요 없을 때

상황 CoT 효과 이유
수학·계산 문제 매우 큼 중간 단계가 누적 오류 줄임
다단계 논리 추론 매우 큼 조건을 하나씩 체크 가능
의사결정·비교 분석 기준별로 쪼개서 평가
코드 디버깅 가능한 원인을 순서대로 점검
단순 사실 질문 거의 없음 "한국 수도는?"에 사슬 불필요
창작·번역 보통 오히려 어색해질 수도

요약하면, 추론이 필요한 작업일수록 CoT가 빛납니다. "오늘 날씨 어때" 같은 단답형 질문에까지 굳이 단계별 사고를 시키면 답이 길고 부자연스러워지니 상황에 맞게 쓰면 됩니다.

가장 기본이 되는 CoT 트리거 한 줄

이 한 줄만 알아도 절반은 끝납니다.

단계별로 차근차근 생각한 뒤 답해주세요.

영어권에서는 "Let's think step by step"이라는 문장이 거의 마법의 주문처럼 알려져 있는데, 한국어로 옮기면 위 문장이 그 역할을 합니다. 질문 끝에 그냥 한 줄 덧붙이면 됩니다.

예를 들어 다음 두 프롬프트의 차이를 직접 비교해 보면 감이 옵니다.

[A] 사과 12개를 4명에게 나눠주고, 그 중 한 명이 자기 몫의
절반을 다른 사람에게 줬다면 가장 많이 가진 사람의 사과 수는?

[B] 사과 12개를 4명에게 나눠주고, 그 중 한 명이 자기 몫의
절반을 다른 사람에게 줬다면 가장 많이 가진 사람의 사과 수는?
단계별로 차근차근 생각한 뒤 답해주세요.

A는 종종 "6개"처럼 단순 합산만으로 답하지만, B는 "1단계: 12÷4=3", "2단계: 한 명이 1.5개 전달", "3단계: 받은 사람은 3+1.5=4.5개" 식으로 풀어 정답을 더 안정적으로 냅니다. (저도 처음엔 이 한 줄 차이가 이렇게 클까 의심했는데, 직접 돌려보니 차이가 분명했습니다.)

한국어 템플릿 8개

아래 템플릿은 모두 ChatGPT, Claude, Gemini 같은 일반 챗봇에 그대로 붙여넣어 쓸 수 있습니다. [대괄호] 부분만 자기 상황에 맞게 채우면 됩니다.

1. 기본형 — 가벼운 추론

다음 질문에 답하기 전에, 먼저 어떤 정보가 필요한지
정리하고 단계별로 추론한 뒤 최종 답을 제시해주세요.

질문: [여기에 질문]

가장 무난한 형태입니다. 일반적인 질문에 두루 씁니다.

2. 수학·계산 전용

아래 문제를 풀어주세요. 다음 형식을 지켜주세요.

1) 문제에서 주어진 정보 정리
2) 풀이에 필요한 공식 또는 접근법
3) 단계별 계산 과정 (각 줄마다 무엇을 계산하는지 명시)
4) 최종 답
5) 검산: 답이 말이 되는지 한 번 더 확인

문제: [여기에 문제]

검산 단계를 강제로 넣은 게 핵심입니다. 단순 산수도 의외로 틀리는 LLM이 있어서, 마지막에 한 번 더 짚어주면 오답률이 눈에 띄게 줄어듭니다.

3. 의사결정 비교

다음 옵션 중 [목적]에 가장 적합한 것을 골라주세요.
바로 결론짓지 말고 아래 순서로 분석해주세요.

1단계: 각 옵션의 장단점을 표로 정리
2단계: [목적] 관점에서 가장 중요한 평가 기준 3개 선정
3단계: 각 옵션을 기준별로 점수화 (1~5점)
4단계: 점수 합산 및 최종 추천
5단계: 추천이 바뀔 수 있는 조건이 있다면 명시

옵션:
- [옵션 A]
- [옵션 B]
- [옵션 C]

"노트북 A vs B 중 뭐가 좋아?" 같은 질문에 CoT 없이 물으면 답이 두루뭉술하게 나오기 쉽습니다. 이 템플릿을 쓰면 평가 기준부터 명시되므로, 답이 마음에 안 들 때도 어디를 다시 물어봐야 할지가 보입니다.

4. 코드 디버깅

아래 코드가 의도대로 동작하지 않습니다. 다음 순서로 진단해주세요.

1) 코드가 무엇을 하려는 코드인지 한 줄 요약
2) 실행 흐름을 단계별로 따라가며 각 줄에서 변수가 어떻게 변하는지 추적
3) 문제가 발생할 수 있는 구간 후보 3개
4) 가장 가능성 높은 원인 1개 선택 및 근거
5) 수정된 코드 제시

기대 결과: [예: 1부터 10까지 합계 출력]
실제 결과: [예: 45가 나옴]

코드:
[여기에 코드]

비개발자분들도 ChatGPT에게 코드 한 줄 받아 쓰는 시대라, 이 템플릿이 의외로 유용합니다.

5. 글쓰기 구조 잡기

[주제]에 대한 [글 종류]를 쓰려고 합니다. 바로 본문을 쓰지 말고
아래 순서로 먼저 구조를 잡아주세요.

1) 이 글의 핵심 메시지 한 문장
2) 타깃 독자가 이미 알고 있을 것 vs 모를 것 구분
3) 도입-전개-마무리 각 섹션의 역할
4) 각 섹션에서 다룰 핵심 포인트 3개씩
5) 예상 분량과 어조 제안

저는 다음 단계에서 이 구조를 보고 본문 작성을 요청하겠습니다.

블로그·보고서·이메일 작성에 두루 씁니다. AI가 갑자기 본문을 쏟아내는 걸 막고, 구조부터 함께 검토할 수 있어 결과물 품질이 훨씬 안정적입니다.

6. 데이터 해석

아래 데이터를 분석해주세요. 다음 형식을 지켜주세요.

1) 데이터의 종류와 단위 확인
2) 눈에 띄는 패턴 또는 이상치 3가지
3) 각 패턴이 의미할 수 있는 가설 (한 패턴당 2개 이상)
4) 가설을 검증하려면 추가로 어떤 데이터가 필요한지
5) 현재 데이터만으로 내릴 수 있는 결론과, 내릴 수 없는 결론 구분

데이터:
[여기에 표·수치]

엑셀 데이터 붙여넣고 해석 부탁할 때 좋습니다. 특히 "내릴 수 없는 결론"을 명시하라고 시키는 부분이 중요한데, 이게 없으면 AI가 데이터에 없는 내용까지 그럴듯하게 지어내는 경향이 있습니다.

7. 학습·요약 (Self-explanation)

아래 내용을 제가 완전히 이해했는지 점검하려 합니다.
다음 순서로 도와주세요.

1) 내용을 초등학생도 이해할 수준으로 한 단락 요약
2) 핵심 개념 5개 추출 및 각각 한 줄 정의
3) 개념 간 관계를 화살표 도식으로 표현 (텍스트로)
4) 제가 헷갈릴 만한 지점 3개와 그 이유
5) 이해도 점검용 질문 3개 (답은 알려주지 말 것)

원문:
[여기에 텍스트]

논문이나 긴 아티클을 공부할 때 강력합니다. 그냥 "요약해줘"보다 머리에 훨씬 잘 남습니다.

8. Self-Consistency 변형

[질문]에 대해 서로 다른 접근법으로 3번 풀어주세요.
각 풀이마다 단계별 추론을 보여주고, 마지막에 세 답을
비교한 뒤 가장 일관성 있는 답을 최종 답으로 제시해주세요.

질문: [여기에 질문]

한 번의 추론이 불안할 때, 같은 모델에게 여러 경로로 풀게 한 뒤 다수결을 시키는 기법입니다. 정답률이 더 올라간다는 연구가 있고(Wang et al., 2022, "Self-Consistency"), 토큰을 좀 더 쓰는 대신 까다로운 문제에서 효과가 큽니다.

CoT 프롬프트 설계의 흐름

   질문 정의
      ↓
   추론이 필요한가?  ── 아니오 → 일반 프롬프트로 충분
      ↓ 예
   몇 단계 추론?
   ├─ 2~3단계 → 기본 트리거 한 줄
   └─ 5단계 이상 → 단계 명시 템플릿
      ↓
   검산·자기점검 추가
      ↓
   답이 여전히 불안하면 → Self-Consistency

처음부터 8번 같은 무거운 템플릿을 쓸 필요는 없습니다. 1번 기본형으로 시작해서, 결과가 부족하면 단계를 더 명시하는 방향으로 올라가는 게 효율적입니다.

자주 막히는 부분

"단계별로 생각해" 한 줄 넣었는데 효과가 없어요. 모델 버전이 작거나(예: 옛날 GPT-3.5) 질문 자체가 추론이 거의 필요 없는 단답형일 가능성이 큽니다. 이때는 템플릿 2~4번처럼 단계를 직접 번호 매겨 지정하면 거의 확실하게 동작합니다.

답이 너무 장황해졌어요. CoT의 부작용입니다. 마지막에 "최종 답만 한 문장으로 요약" 같은 출력 형식을 추가하거나, "사고 과정은 5줄 이내로" 같은 분량 제약을 걸면 됩니다.

일본어·영어가 섞여 나와요. 프롬프트 끝에 "모든 답변은 한국어로 작성해주세요" 한 줄을 추가하세요. 의외로 자주 발생하는데 한 줄로 해결됩니다.

민감한 정보가 들어간 데이터를 분석시켜도 되나요? 서비스마다 데이터 학습 정책이 다릅니다. OpenAI는 ChatGPT 설정에서 학습 거부 옵션이 있고, Claude는 기본적으로 사용자 대화를 학습에 쓰지 않는다고 공식 소개에 명시돼 있습니다(글 작성 시점 기준). 그래도 회사 내부 자료나 개인정보는 가급적 익명화 후 넣는 게 안전합니다.

마무리

CoT는 거창한 기법처럼 보이지만, 본질은 "답하기 전에 생각을 적게 시키자"는 단순한 아이디어입니다. 위 템플릿 8개 중 본인이 자주 마주치는 시나리오 1~2개만 골라 메모장에 저장해두고 써보시면, 며칠 안에 AI 답변 품질이 달라지는 게 체감됩니다. 저도 의사결정 비교(3번)랑 글쓰기 구조(5번)는 거의 매일 씁니다. 다음에 까다로운 질문을 던질 일이 있으면, "단계별로 차근차근 생각한 뒤 답해주세요" 한 줄부터 한번 붙여보시길 권합니다.

반응형