Claude를 더 오래, 더 잘 쓰는 법
"한계"가 아니라 "예산"이다
AI를 매일 쓰다 보면 누구나 한 번쯈은 이런 경험을 한다. 한참 작업에 몰입해 있다가 갑자기 "사용량 한도에 도달했습니다"라는 메시지를 만나는 순간. 분명 몇 마디 주고받은 것 같은데 왜 벌써 한도에 걸렸을까 싶고, 다음 작업까지 몇 시간을 기다려야 한다는 사실에 김이 빠진다.
그런데 이 한도라는 걸 조금만 들여다보면, 생각보다 단순한 원리로 작동한다는 걸 알게 된다. 그리고 그 원리를 이해하고 나면 같은 요금제로도 훨씬 더 많은 일을 할 수 있다.

두 가지 한계가 따로 존재한다
먼저 알아야 할 건, Claude를 쓸 때 마주치는 제약이 사실 하나가 아니라 두 종류라는 점이다.
첫 번째는 사용량 한도(Usage limit)다. Anthropic의 공식 고객센터 설명에 따르면 Pro, Max, Team 같은 유료 플랜은 5시간 단위로 굴러가는 롤링 윈도우 방식으로 운영된다. 자정에 초기화되는 게 아니라, 첫 메시지를 보낸 시점부터 5시간이 지나면 그 메시지의 사용량이 슬슬 빠지기 시작하는 구조다. 게다가 이 한도는 claude.ai 채팅, Claude Code, Cowork를 가리지 않고 공유된다. 한쪽에서 많이 쓰면 다른 쪽에서 쓸 수 있는 양도 함께 줄어든다는 뜻이다. 여기에 더해 주간 단위로도 별도의 캡이 걸려 있어서, 짧은 시간에 몰아쓰는 것과 일주일 내내 꾸준히 많이 쓰는 것은 서로 다른 방식으로 한도에 영향을 준다.
두 번째는 컨텍스트 윈도우(작업 기억)다. 이건 사용량과는 결이 다른 문제다. 대화가 길어질수록 Claude는 매 턴마다 그 대화 전체를 다시 읽어야 한다. 10번째 메시지를 보낼 때는 사실상 1번부터 9번까지를 전부 다시 처리하고 있는 셈이다. 대화가 일정 길이를 넘기면 모델은 가장 오래된 부분을 흐릿하게 인식하게 되고, 답변의 질도 슬쩍 떨어진다. 다행히 코드 실행 기능이 켜져 있으면 컨텍스트가 한계에 가까워질 때 자동으로 이전 메시지를 요약해서 대화를 이어가도록 해주지만, 이런 자동 정리가 자주 일어날수록 사용량도 더 빠르게 소모된다는 점은 기억해 둘 만하다.
요점은 이거다. 메시지를 많이 보냈다고 벌을 받는 게 아니라, 처리해야 할 컨텍스트가 비싸지기 때문에 한도에 걸리는 것이다. 그러니 "몇 개 보냈는지"보다 "얼마나 무거운 대화인지"가 훨씬 중요하다.
새 대화가 가장 강력한 무기다
여러 절약법 중에서 가장 효과가 큰 건 의외로 단순하다. 바로 새 대화를 시작하는 것.
대화가 15~20개 메시지를 넘기기 시작하면, 매 턴 다시 읽어야 하는 히스토리도 같이 늘어난다. 한 사용자가 직접 측정해 본 결과, 30개 메시지짜리 대화는 23만 토큰 가까이를 태우는데, 그중 실제 새로운 답변에 쓰인 토큰은 1.5%에 불과했다는 사례도 있다. 나머지 98.5%는 그저 과거 대화를 다시 읽는 데 쓰인 셈이다.
그래서 한 가지 작업이 끝나면 "지금까지 논의한 내용을 요약해줘"라고 부탁하고, 그 요약을 복사해 새 대화의 첫 메시지로 붙여넣는 습관이 의외로 효과적이다. 맥락은 유지하면서 무거운 히스토리는 떼어내는 방법이다.
비슷한 이유로, 답변이 마음에 안 들 때 "다시 해줘", "이렇게 바꿔줘" 같은 후속 메시지를 계속 추가하는 것보다, 원래 메시지를 수정해서 다시 보내는 편이 낫다. 새 메시지를 쌓는 대신 기존 교환을 통째로 교체하기 때문에 대화가 불필요하게 길어지지 않는다.
모델과 작업의 난이도를 맞추기
Opus, Sonnet, Haiku처럼 여러 모델이 있다면, 작업의 무게에 맞춰 고르는 것도 큰 차이를 만든다. 복잡한 추론이 필요한 작업에는 가장 강력한 모델을, 초안 작성이나 일상적인 질문에는 가벼운 모델을 쓰는 식이다. 같은 작업을 처리하더라도 더 무거운 모델은 같은 사용량 한도 안에서 훨씬 빨리 소모된다.
Claude Code를 쓴다면 알아야 할 명령어 두 가지
코드 작업에 Claude Code를 쓰는 사람이라면 /clear와 /compact라는 두 명령어를 구분해서 쓰는 게 좋다. /clear는 대화를 완전히 비우는 명령으로, 작업 주제를 바꿀 때 쓰면 좋다. CLAUDE.md나 프로젝트 파일은 그대로 남아 있고 채팅 히스토리만 사라진다. 반면 /compact는 지금까지의 대화를 짧게 요약해서 공간을 비우는 명령으로, 한 작업을 계속 이어가는 도중에 쓰기 적합하다. 컨텍스트가 한도에 가까워지면 자동으로 압축이 일어나기도 하지만, 직접 타이밍을 조절하면 품질과 비용 양쪽에서 더 유리하다.
CLAUDE.md 파일을 활용하는 것도 도움이 된다. 매 세션마다 프로젝트 맥락을 새로 설명하는 대신, 한 번 정리해 둔 파일을 Claude가 매 턴 참고하게 만드는 방식이다. 다만 이 파일도 매 턴 다시 처리되는 컨텍스트이기 때문에, 같은 실수를 두 번 이상 교정했을 때만 한 줄씩 추가하고 200줄 정도를 넘지 않도록 정리하는 게 좋다는 조언이 많다.
프로젝트 기능으로 반복을 줄이기
매번 같은 문서나 배경 설명을 새로 붙여 넣는 대신, Projects 기능에 자료를 한 번 올려두면 RAG(검색 증강 생성) 방식으로 필요한 부분만 불러와 처리한다. 전체 문서를 매번 통째로 컨텍스트에 넣는 것보다 훨씬 효율적이다. 계약서, 브랜드 가이드, 논문처럼 자주 참조하는 문서가 있다면 특히 체감이 크다.
첨부파일과 프롬프트도 가볍게
PDF나 이미지, 긴 로그 파일을 첨부할 때도 비용을 생각해 볼 만하다. 50페이지짜리 문서를 통째로 올리는 대신 필요한 부분만 추려서 넣으면 처리해야 할 양 자체가 줄어든다. 마찬가지로 모호한 프롬프트를 보내면 Claude가 되묻는 과정에서 왔다 갔다 하는 턴이 늘어나니, 한 번에 명확하게 요청을 모아서 보내는 것도 도움이 된다. "이 글 요약해줘", "그리고 핵심 포인트도 뽑아줘", "헤드라인도 추천해줘"를 세 번에 나눠 보내는 대신 한 메시지에 다 담는 식이다.
결국은 예산 관리다
이 모든 팁을 한 문장으로 줄이면 이렇다. Claude의 사용량은 정해진 예산이고, 컨텍스트는 그 예산을 얼마나 빨리 태우는지를 결정하는 변수다. 메시지 개수를 줄이는 게 목표가 아니라, 같은 예산으로 더 무게 있는 작업을 처리하는 게 목표다.
새 대화로 시작하고, 작업에 맞는 모델을 고르고, 긴 대화는 요약해서 이어가고, 반복되는 자료는 Projects에 올려두는 것. 이 네 가지만 습관으로 만들어도 같은 요금제 안에서 훨씬 더 오래, 더 깊이 작업할 수 있다.
더 자세한 내용은 Anthropic 공식 고객센터의 사용량 및 길이 한도 안내와 사용량 한도 활용 팁 문서에서 확인할 수 있다. 구체적인 한도 수치는 요금제와 시점에 따라 달라질 수 있으니, 정확한 숫자가 필요하다면 항상 설정 > 사용량 페이지에서 직접 확인하는 게 가장 정확하다.
와인병다육이세상사는이야기
창조적이고 유니크한 와인병다육이의 세상사는 이야기
kenny762.tistory.com
'컴퓨터,AI' 카테고리의 다른 글
| 퍼플렉시티로 업무를 숨 쉬듯 가볍게 하는 방법을 알아보자 (0) | 2026.06.22 |
|---|---|
| 당신을 막을 수 없게 만드는 스토리텔링 기법 (1) | 2026.06.22 |
| Excel Checklist로 배우는 실전 활용방법 (1) | 2026.06.21 |
| "이걸 왜 이제야 알았을까" 마이크로소프트 코파일럿 알아보자 (0) | 2026.06.21 |
| Copilot 활용법 업무 생산성을 바꾸다 (0) | 2026.06.21 |
댓글