bitkub-banner

5 เคล็ดลับใช้ Claude Code ให้ Token อยู่ได้นานขึ้น 3 เท่า

พร้อมเล่น 0:00 / 0:00
สรุปข่าว
  • Claude Code กิน Token เร็วเพราะส่งทั้ง Context, ไฟล์ และ Output เก่าเข้า AI ทุกครั้ง ยิ่ง Session ยาวยิ่งแพง
  • เทคนิคที่ช่วยลดการใช้ Token ได้จริงคือ /clear, /compact, ใช้ Subagent และเลือก Model ให้ตรงงาน
  • หลาย Community และ Official Docs ยืนยันตรงกันว่า การจัดการ Context สำคัญกว่าการจ่ายแพ็กเกจแพงขึ้น

แนวโน้มผลกระทบต่อราคา: Neutral

ข่าวนี้ไม่ได้ส่งผลโดยตรงต่อราคาเหรียญหรือหุ้น แต่สะท้อนว่าเครื่องมือ AI Coding อย่าง Claude Code กำลังถูกใช้งานจริงในระดับหนักมากขึ้น ซึ่งเป็นสัญญาณบวกต่อภาพรวมตลาด AI Developer Tools และการแข่งขันด้าน AI Coding Assistant ในระยะยาว

ปัญหาที่นักพัฒนาหลายคนเจอเหมือนกันคือ Claude Code กิน Token เร็วกว่าที่คิด บางคนนั่งเขียนโค้ดยังไม่ถึงครึ่งวัน Quota ก็หมด ทั้งที่ไม่ได้ทำงานหนักมากนัก

Anthropic Docs อธิบายว่า Claude Code ไม่ได้ส่งแค่ Prompt ล่าสุดเข้า AI แต่จะส่งทุกอย่างใน Session ไปด้วยทุกครั้ง ทั้งข้อความเก่า ไฟล์ที่เคยอ่าน และ Output จาก Command ต่าง ๆ ทำให้ Session ที่ยาวขึ้นเรื่อย ๆ กิน Token มากขึ้นและเริ่มช้าลงตามไปด้วย

ขณะที่ Anthropic Cost Guide ระบุว่า Enterprise Deployment มีค่าใช้จ่ายเฉลี่ยประมาณ $13 ต่อคนต่อวัน หรือราว $150–250 ต่อเดือน ซึ่งสูงกว่าค่า Subscription ปกติพอสมควร หากไม่มีการจัดการ Context ที่ดี

Checklist ก่อนเริ่มใช้

ก่อนจะไปถึงเคล็ดลับ มีสิ่งที่ควรเตรียมให้พร้อมก่อน

  • ติดตั้ง Claude Code และ Login เรียบร้อย
  • รู้จักคำสั่งพื้นฐาน: /clear, /compact, /model, /cost
  • มีไฟล์ CLAUDE.md ในโปรเจกต์ (ถ้ายังไม่มี ใช้ /init สร้างได้)
  • เช็ค Usage ปัจจุบันได้ที่ claude.ai → Settings → Usage

เคล็ดลับที่ 1 รู้จังหวะใช้ /compact และ /clear ให้ถูกต้อง

ปัญหาที่เจอบ่อย: หลายคนรอให้ Claude เริ่มลืม Context แล้วค่อย Compact ซึ่งจริง ๆ ช้าเกินไปแล้ว

KDnuggets อธิบายว่า Session ที่เริ่ม Overload จะสรุป Context ได้ไม่สะอาด ทำให้ Summary ที่ได้มีข้อมูลรบกวนและกิน Token มากขึ้นในทุก Message ถัดไป ดังนั้นควร Compact ตั้งแต่ตอนที่ Session ยัง “สะอาด” จะช่วยได้มากกว่า

วิธีใช้อย่างถูกจังหวะ:

คำสั่งที่ใช้เมื่อทำงานหนึ่ง Task เสร็จและจะต่อ Task ถัดไปในธีมเดียวกัน

/compact Focus on code changes and test results

คำสั่งที่ใช้เมื่อจะเปลี่ยนไปทำงานใหม่ที่ไม่เกี่ยวข้องกับงานเดิม

/clear

ก่อน Clear ให้ Rename Session ก่อนเพื่อกลับมาได้

/rename feature-auth-login
/clear

Anthropic Help Center สรุปง่าย ๆ ว่า “/clear ใช้ตอนเริ่มงานใหม่ที่ไม่เกี่ยวกัน ส่วน /compact ใช้เมื่อยังทำงานเดิมแต่ต้องการลด Context” และยังระบุว่าเคส “Token หมดก่อนเที่ยง” ส่วนใหญ่มักเกิดจากการไม่ Clear หรือ Compact ระหว่าง Task

ประหยัด Token โดยประมาณ: 40–60% สำหรับ Session ที่มีหลายงานต่อเนื่อง

เคล็ดลับที่ 2 เขียน CLAUDE.md ให้สั้นและตรงประเด็น

ความเข้าใจผิดที่พบบ่อย: หลายคนคิดว่า CLAUDE.md ยิ่งละเอียดยิ่งดี แต่จริง ๆ แล้วไฟล์นี้จะถูกโหลดเข้า Context ทุกครั้งที่เริ่ม Session

Anthropic Best Practices Docs แนะนำว่า CLAUDE.md ควร “สั้น อ่านง่าย และมีเฉพาะสิ่งที่ Claude เดาเองไม่ได้” เช่น Command ที่ใช้บ่อย, Coding Style หรือ Workflow Rules สำคัญ

ตัวอย่าง CLAUDE.md ที่ดี:

Code Style

- Use ES modules (import/export), not CommonJS
- TypeScript strict mode, no any types

Commands

- Test: npm test
- Build: npm run build
- Lint: npm run lint

Workflow

- Run tests after every file change
- Never modify /legacy directory

สิ่งที่ไม่ควรใส่ใน CLAUDE.md:

  • คำอธิบาย Architecture ยาว ๆ
  • Context เฉพาะ Task
  • โค้ดตัวอย่างขนาดใหญ่

KDnuggets แนะนำว่า CLAUDE.md ที่ดีควรช่วยลด Prompt ที่ต้องพิมพ์ซ้ำ ไม่ใช่เอาไว้แทน Documentation ทั้งโปรเจกต์

ประหยัด Token โดยประมาณ: 10–25% จาก Startup Context ที่เล็กลง

เคล็ดลับที่ 3 ใช้ Subagents แทน Main Thread สำหรับงานหนัก

หลักการ: Subagent คือ Claude Instance แยกต่างหากที่มี Context ของตัวเอง ทำให้ Output ยาว ๆ ถูกเก็บอยู่ใน Subagent และส่งกลับมาแค่ Summary สั้น ๆ ที่ Main Thread

KDnuggets อธิบายว่า ถ้า Subagent อ่านไฟล์จำนวนมากหรือ Run Tests ขนาดใหญ่ Main Context จะไม่บวมตาม เพราะได้รับแค่ผลสรุปกลับมา

งานที่เหมาะกับ Subagent:

รัน Test Suite แล้วรายงานผลสรุป

"use a subagent to run the full test suite and return only failed tests with error messages"

สำรวจ Codebase

"use a subagent to explore /src/auth and summarize the authentication flow in 5 bullet points"

อ่าน Log ไฟล์ขนาดใหญ่

"use a subagent to analyze error.log and identify the top 3 recurring error patterns"

ด้าน Systemprompt.io เตือนว่า ไม่ควรตั้ง CLAUDE_CODE_SUBAGENT_MODEL=haiku แบบไม่ระวัง เพราะ Planner ที่อ่อนเกินไปอาจทำให้ Workflow พังทั้งชุด โดย Sonnet ยังเป็น Default ที่ปลอดภัยกว่า

ประหยัด Token โดยประมาณ: 30–50% สำหรับงานที่อ่านไฟล์จำนวนมากหรือ Run Tests

เคล็ดลับที่ 4 วางแผนงานก่อนเริ่ม Code

ปัญหา: การให้ Claude เริ่มเขียนโค้ดทันทีโดยไม่มี Plan มักทำให้ต้องย้อนแก้หรือ Generate ใหม่ ซึ่งเปลือง Token มากกว่าเดิมหลายเท่า

Anthropic Help Center อธิบายว่า “การวางแผนใช้ Token แค่ไม่กี่ร้อย แต่การ Generate Diff ผิดแล้วต้องย้อนทำใหม่อาจเสียหลายพัน Token”

วิธีใช้ Plan Mode:

กด Shift+Tab สองครั้งเพื่อเข้า Plan Mode หรือพิมพ์ก่อน Code ว่า:

"Before changing anything, list the files you'll touch and what you'll do in each"

หรือหลายคนอาจใช้ Plan ด้วย Opus จากนั้น Execute ด้วย Sonnet

/model opusplan

Anthropic ยังแนะนำ Pattern /model opusplan เพราะใช้ Opus สำหรับวางแผนที่ต้องคิดเยอะ และใช้ Sonnet สำหรับลงมือทำจริง ซึ่งช่วยลด Cost ได้โดยไม่ต้อง Clear Context

ตัวอย่าง Prompt ที่ กว้างเกินไป

"fix the login bug"

ตัวอย่าง Prompt ที่ ระบุชัด

"users report login fails after session timeout.
check src/auth/tokenRefresh.ts only.
write a failing test, then fix it"

ประหยัด Token โดยประมาณ: 20–40% จากการลด Rework และลดการอ่านไฟล์ที่ไม่จำเป็น

เคล็ดลับที่ 5 เลือก Model ให้ตรงกับงาน

ความผิดพลาดที่แพงที่สุด: ใช้ Opus กับทุกอย่าง ทั้งที่หลายงาน Haiku ก็ทำได้

BuildToLaunch ระบุว่า Haiku มีต้นทุนถูกกว่า Opus หลายเท่า และงานที่ใช้เวลาไม่ถึง 30 วินาทีส่วนใหญ่มักไม่จำเป็นต้องใช้ Opus เลย

วิธีเลือก​ Model ตามประเภทงาน

  • งานประเภท Architecture / Multi-file Refacto ใช้ Opus เพราะต้องใช้การคิดหลายขั้น
  • งานประเภท Feature ใหม่ / Debug / เขียน Test ใช้ Sonnet เพราะต้องการความสมดุลทั้งความสามารถและราคา
  • งานประเภท Rename / Format / Boilerplate ใช้ Haiku เพราะเป็นงานง่าย ไม่ต้องคิดเยอะ

คำสั่งที่ใช้ในกาเรปลี่ยน Model ระหว่าง Session ได้

/model haiku
/model sonnet
/model opus

คำสั่งที่ใช้ในการลดขั้นตอนการคิดสำหรับงานง่าย

/effort low
MAX_THINKING_TOKENS=8000

Anthropic Cost Docs แนะนำให้เก็บ Opus ไว้สำหรับงาน Architecture หรืองานใช้เหตุผลที่ซับซ้อนเท่านั้น และใช้ Sonnet เป็น Default สำหรับงานทั่วไป

ประหยัด Token โดยประมาณ: 40–60% หากใช้ Haiku กับงาน Mechanical และใช้ Sonnet เป็น Default

ข้อควรระวัง

  • อย่า Paste ทั้งไฟล์เมื่อไม่จำเป็น Anthropic Help Center แนะนำว่าแทนที่จะ Paste ไฟล์ทั้งก้อน ควรระบุเฉพาะ Function หรือ Path ที่เกี่ยวข้อง เพราะการใช้ @ จะดึงไฟล์ทั้งชุดเข้า Context ทันที
  • อย่าเปิด MCP Server เยอะเกินไป Everything-claude-code เตือนว่า Tool Definitions ทุกตัวกินพื้นที่ใน Context Window ดังนั้นไม่ควรเปิด MCP Server เกินประมาณ 10 ตัวต่อโปรเจกต์
  • อย่าใช้ Haiku กับ Planner หลัก Planner ที่อ่อนเกินไปอาจทำให้ Workflow พังตั้งแต่ต้น และเสีย Token มากกว่าเดิมตอนแก้ปัญหา

หลายคนที่รู้สึกว่า Claude Code แพงเกินไป จริง ๆ แล้วปัญหามักไม่ได้อยู่ที่ราคา แต่อยู่ที่ Session ที่ยาวเกินไป, Context ที่หนักเกินจำเป็น และการใช้ Model ไม่เหมาะกับงาน ซึ่งแค่เริ่มจาก /clear เวลาเปลี่ยน Task และเลือกใช้ Model ให้ถูกประเภท ก็ช่วยลดการใช้ Token ได้ชัดเจนแล้ว

แหล่งข้อมูลอ้างอิง: