YOLO v11 사용법을 비개발자 눈높이에서 풀어낸 입문 가이드입니다. 파이썬 설치부터 첫 객체 인식 결과까지 약 5~10분이면 끝나며, 자주 막히는 환경 설정과 결과 해석법까지 함께 다룹니다.

YOLO라는 이름은 들어봤는데 막상 시작하려고 하면 "파이썬은 어디서 받지?", "GPU 없어도 되나?" 같은 질문이 줄줄이 따라옵니다. 저도 처음 CV(컴퓨터 비전, 컴퓨터가 이미지·영상을 이해하게 만드는 기술 분야)에 발을 들였을 때 같은 벽에 부딪혔습니다. 이 글은 YOLO v11 사용법을 코드 한 줄도 안 써본 분도 따라할 수 있도록 풀어 쓴 입문 가이드입니다. 5분 안에 사진 한 장에서 사람·자동차·강아지를 찾아내는 결과까지 직접 만들어 봅니다. 어렵게 들리는 단어는 그때그때 짧게 풀어 드리니 차근히 따라오시면 됩니다.
YOLO v11이 뭐길래
YOLO v11은 사진이나 영상 속에서 사람·자동차·동물 같은 객체를 자동으로 찾아 네모 상자로 표시해주는 AI 모델입니다. 개발사 Ultralytics가 2024년 9월에 공개한 최신 버전이며, 이전 v8 대비 같은 정확도에서 더 빠르고 가볍다는 게 공식 소개의 핵심입니다.
YOLO는 "You Only Look Once"의 약자로, 이미지를 한 번만 훑어보고 곧바로 답을 내놓는다는 뜻입니다. 사람으로 비유하면 사진을 보자마자 "사람 두 명, 강아지 한 마리"라고 즉답하는 식이에요. 이 빠른 응답성 덕분에 CCTV 분석, 자율주행, 매장 방문객 카운팅 같은 실시간 분야에서 많이 쓰입니다.
| 버전 | 공개 시점 | 특징 |
|---|---|---|
| YOLO v8 | 2023년 1월 | 대중적 보급, 자료 풍부 |
| YOLO v9 | 2024년 2월 | 정확도 개선 |
| YOLO v10 | 2024년 5월 | 후처리 단순화 |
| YOLO v11 | 2024년 9월 | 더 적은 파라미터로 더 높은 정확도 |
💡 v11이 최신이라고 무조건 좋은 건 아닙니다. 자료가 많은 v8을 일부러 쓰는 분도 많습니다. 다만 새로 시작한다면 v11이 합리적입니다.
시작 전 준비물
YOLO v11을 돌리는 데 필요한 건 파이썬 3.8 이상과 인터넷이 되는 컴퓨터 두 가지뿐입니다. GPU(그래픽카드 가속, AI 연산을 빠르게 해주는 부품)가 있으면 좋지만 없어도 사진 한 장 분석은 노트북 CPU로도 1~3초면 끝납니다.
준비 체크리스트는 다음과 같습니다.
- [ ] 윈도우 10 이상 또는 macOS 12 이상
- [ ] 여유 디스크 공간 약 3GB (파이썬 + 라이브러리 + 모델 파일)
- [ ] 인터넷 연결 (모델을 처음 한 번 다운로드할 때 필요)
- [ ] 분석해볼 테스트용 사진 1장 (스마트폰으로 찍은 거실 사진이면 충분)
파이썬은 python.org 공식 사이트에서 받습니다. 설치할 때 화면 하단의 "Add Python to PATH" 체크박스를 꼭 켜세요. 이걸 깜빡하면 나중에 명령어가 안 먹혀서 한참 헤맵니다(저도 그랬습니다).
설치가 끝났는지는 터미널(검은 화면에 명령어를 입력하는 프로그램. 윈도우는 "명령 프롬프트", 맥은 "터미널" 앱)에서 다음 명령으로 확인합니다.
python --version
Python 3.11.5 같은 숫자가 나오면 성공입니다. 안 나오면 PATH 체크를 빼먹은 경우라 재설치하면 해결됩니다.
설치는 명령어 한 줄
YOLO v11은 ultralytics라는 라이브러리(미리 만들어둔 도구 묶음) 안에 들어 있어서, 명령어 한 줄이면 모든 게 깔립니다.
터미널에서 아래 명령을 입력합니다.
pip install ultralytics
이 명령은 "YOLO를 돌리는 데 필요한 모든 부품을 자동으로 받아서 깔아줘"라는 뜻입니다. pip은 파이썬 세계의 앱스토어 같은 도구라고 보면 됩니다.
설치는 보통 1~2분 걸리며, 마지막 줄에 Successfully installed ultralytics-8.x.x 비슷한 문구가 뜨면 끝입니다. 중간에 빨간 글씨로 에러가 떠도 마지막에 Successfully가 보이면 정상이니 너무 놀라지 마세요.
[설치 흐름]
pip 명령 입력
↓
필요 라이브러리 자동 다운로드
(torch, numpy, opencv 등)
↓
약 1~2분 대기
↓
Successfully installed 출력 → 완료
⚠️ 회사 노트북처럼 보안 정책이 걸린 환경에서는 pip 명령이 막힐 수 있습니다. 그럴 땐 개인 노트북이나 카페 와이파이에서 시도해보거나, IT 담당자에게 사내 프록시 설정을 문의해야 합니다.
첫 객체 인식 실행
이제 진짜 5분 컷의 핵심입니다. 분석하고 싶은 사진을 적당한 폴더에 test.jpg라는 이름으로 저장하세요. 그리고 같은 폴더에서 터미널을 열고 한 줄을 입력합니다.
yolo predict model=yolo11n.pt source=test.jpg
이 명령은 "yolo11n이라는 모델로 test.jpg 안의 객체를 찾아라"는 뜻입니다. 처음 실행할 땐 yolo11n.pt라는 모델 파일(약 5MB)을 자동으로 받아오느라 5~10초 더 걸립니다.
실행이 끝나면 터미널에 이런 비슷한 결과가 뜹니다.
image 1/1 .../test.jpg: 384x640 2 persons, 1 dog, 1 chair, 45.2ms
Speed: 2.1ms preprocess, 45.2ms inference, 1.3ms postprocess
Results saved to runs/detect/predict
해석하면 "사진 안에 사람 2명, 강아지 1마리, 의자 1개를 찾았고 45밀리초 걸렸다"는 뜻입니다. runs/detect/predict 폴더에 들어가면 원본 사진 위에 색깔 네모 상자가 그려진 결과 이미지가 저장돼 있습니다.
이게 끝입니다. 진짜로요.
결과 화면 읽는 법
| 표시 | 의미 |
|---|---|
| 색깔 네모 상자 | 찾아낸 객체의 위치 |
상자 위 글자 (예: person 0.89) |
객체 이름 + AI의 자신감 점수 (0~1 사이) |
| 자신감 0.5 이상 | 보통 신뢰할 만한 결과 |
| 자신감 0.3 이하 | 오인식일 가능성이 높음 |
자신감 점수는 사람으로 치면 "이게 사람일 확률 89%"라고 답하는 자기 확신의 정도라고 보면 됩니다.
모델 크기 고르는 법
YOLO v11은 한 가지가 아니라 5가지 크기로 나뉩니다. 작을수록 빠르고, 클수록 정확합니다. 명령어의 yolo11n.pt에서 n 부분만 바꾸면 됩니다.
| 모델 | 파일 크기 | 속도(CPU 기준) | 추천 용도 |
|---|---|---|---|
| yolo11n (nano) | 약 5MB | 가장 빠름 | 노트북 테스트, 라즈베리파이 |
| yolo11s (small) | 약 19MB | 빠름 | 일반 데스크톱 |
| yolo11m (medium) | 약 40MB | 중간 | 정확도와 속도 균형 |
| yolo11l (large) | 약 50MB | 느림 | GPU 보유 시 권장 |
| yolo11x (xlarge) | 약 110MB | 가장 느림 | 정확도 최우선 작업 |
처음에는 yolo11n으로 감을 잡고, 결과가 부정확하면 한 단계씩 올려가며 비교해 보는 게 합리적입니다. 예를 들어 어두운 사진에서 사람을 자꾸 놓친다면 yolo11m으로 바꿔보는 식입니다.
💡 일반 노트북에서 영상 실시간 분석을 하려면yolo11n이나yolo11s정도가 현실적입니다.yolo11x는 GPU 없이는 영상이 슬로모션처럼 느껴질 수 있습니다.
자주 막히는 부분
5분이면 된다고 했지만 솔직히 말하면 환경 문제로 30분 까먹는 경우도 흔합니다. 제가 직접 겪었거나 주변에서 자주 본 사례를 정리합니다.
pip: command not found 또는 'pip'은(는) 인식되지 않습니다 파이썬 설치 시 PATH 체크를 빼먹은 경우입니다. 파이썬을 제거하고 재설치하면서 "Add Python to PATH"를 반드시 체크하세요.
ModuleNotFoundError: No module named 'ultralytics' 설치는 됐는데 다른 파이썬 버전에 깔린 경우입니다. pip3 install ultralytics로 다시 시도해보세요.
모델 다운로드가 안 됨 회사·학교 네트워크에서 GitHub 접근이 막힌 경우가 많습니다. 개인 와이파이로 옮기거나 모바일 핫스팟으로 한 번만 받아두면 이후엔 인터넷 없이도 쓸 수 있습니다.
결과가 너무 느림 (사진 한 장에 30초 이상) 오래된 노트북이라 그럴 수 있습니다. yolo11n으로 바꾸고, 사진 해상도를 1280×720 정도로 줄이면 보통 10초 안쪽으로 떨어집니다.
원하는 객체를 못 찾음 기본 모델은 COCO라는 80개 카테고리(사람, 자동차, 의자, 강아지 등)만 인식합니다. "내 회사 로고"나 "특정 부품" 같은 건 별도 학습(파인튜닝)이 필요합니다. 이건 입문 단계를 넘어선 주제라 다음 글에서 다루겠습니다.
마무리
여기까지 따라오셨다면 이미 사진 한 장에서 객체를 찾아내는 결과물을 손에 쥐고 계실 겁니다. 명령어 두 줄(pip install과 yolo predict)이 전부였다는 게 좀 허무하기도 하죠. 저도 처음 돌렸을 땐 "이게 다라고?" 싶었습니다.
다음 단계로는 영상 파일 분석(source=video.mp4로 바꾸기), 웹캠 실시간 분석(source=0), 결과를 엑셀로 정리하기 같은 응용을 추천합니다. 모두 명령어 옵션 한두 개만 바꾸면 돼서 부담이 적습니다. 더 나아가 본인 데이터로 모델을 학습시키는 단계까지 가면 진짜 실무용 도구가 됩니다.
YOLO를 5분 안에 돌려보는 경험은 작아 보여도, AI 모델이 내 폴더에서 직접 동작한다는 감각을 처음으로 갖게 해줍니다. 이 감각이 다음 도전의 연료가 됩니다.
'개발 & 기술 > 컴퓨터 비전' 카테고리의 다른 글
| 실시간 얼굴 인식 만들기 — 웹캠으로 30분 완성 (0) | 2026.05.26 |
|---|---|
| 우분투에 OpenCV 3.0 설치 (0) | 2015.09.22 |
| [우분투 12.04] 우분투12.04에 OpenCV 2.4 설치하기 (0) | 2015.09.21 |
| PCL 1.8 Install (0) | 2015.09.11 |
| Trouble Shooting (0) | 2014.09.28 |