Claude Codeのeffort設定で課金が10倍変わる話｜週末SEのモデル使い分け術

この記事でわかること

結論から言うと、Claude Codeはモデルを変えるより先に「effort（工数）設定」を見直した方が財布に効く。同じ依頼でもLowとMaxで消費トークンが最大10倍変わるから。この記事ではOpus 4.6/4.7/4.8の違い、effortの仕組み、高速モードやsubagentでの節約ワザまで、週末SEの自分が実際に使ってる設定を全部出す。

記事概要図

週末SEがトークン代にビビった話

正直に言うと、自分はずっと「最新が4.7なら、旧モデルの4.6の方が安いやろ」と思って4.6を使い続けてた。旧バージョン＝割引、みたいな感覚。会社員で週末しか触らない身からすると、月の利用枠は地味に気になるんだよね。

で、今回ちゃんと調べたら、この思い込みは半分だけ当たってて半分間違ってた。しかもそれ以前に、モデルより先に見るべき設定を完全に見落としてた。それがeffortだった。

effortって何？トークン代が10倍変わる仕組み

effort（工数）は、Claudeが答える前にどれだけ「考える」かを決めるツマミ。Claude Codeでは画面右下のモデル名の横から切り替えられる。

レベル	中身	トークン消費
Low	単純な質問・軽作業。ほぼ考えずに即答	最小
Medium	日常的なコーディング	中
High	複雑な推論。Opus 4.8の標準はここ	多
Max	最難問題・コスト度外視	最大

※Opus 4.7以降は「High」と「Max」の間に「xhigh」も追加されている。

ポイントは、この「考える」ぶんのトークン（思考トークン）が、出力と同じ単価で課金されること。だからツマミを上げるほど、回答1回あたりの金額がそのまま膨らむ。

公式ドキュメントや実測レポートいわく、同じ依頼でもLowとMaxで消費トークンが10倍以上変わることがある。ただしこれは固定の倍率ではなく、タスクの複雑さに依存する。軽い作業ほど差が開きやすい。

逆に言えば、「ファイル名を直して」レベルの作業にMaxを使うのは、タクシーで隣のコンビニに行くようなもの。まずeffortを作業の重さに合わせる。これが一番効くレバーだ。

4.6・4.7・4.8、結局どれを使えばいい？

冒頭の思い込みの答え合わせをする。

まず単価は3バージョンとも同じ。 旧モデル割引は存在しない。

モデル	入力（100万トークン）	出力（100万トークン）
Haiku 4.5	$1	$5
Sonnet 4.6	$3	$15
Opus 4.6 / 4.7 / 4.8	$5	$25

じゃあ「4.6の方が安い」は完全な間違いかというと、そうでもない。Opus 4.7から新しいトークナイザーが導入されて、同じ文章でも最大35%多くトークンを消費するようになった。4.8もこのトークナイザーを引き継いでいる。単価が同じでも、同じ文章なら4.6の方が消費トークンは少ない。「4.6を使い続けていた自分」は、短いやり取りについては結果的に正解だったわけだ。

ただし新しいモデルには明確な強みもある。

ベンチマーク	Opus 4.7	Opus 4.8
SWE-bench Pro（コード実装）	64.3%	69.2%
SWE-bench Verified	87.6%	88.6%
USAMO 2026（数学）	69.3%	96.7%

4.8の目玉は数学推論が96.7%まで跳ねたことと、自分のコードの欠陥を見逃す確率が4分の1になったこと。さらに4.8は「少ない手数でタスクを終える」方向で最適化されている。

整理するとこうなる。

複数ステップのコード作業（生成・大きめリファクタ）→ 手数が減るぶん最新の4.8が結果的に得
短い会話・単純作業の繰り返し→ トークナイザー膨張がそのまま効くので、最新が必ず得とは言えない。それよりeffortをLowに下げる方が効く

effort以外の節約ワザ（高速モードとsubagent）

高速モード（/fast）

/fast で切り替えるとOpusが2.5倍速くなる。中身は同じモデルで、インフラ側で速度優先にしているだけ。品質は変わらない。ただし課金が上がる。バージョンで割増率が大きく違う点に注意。

モデル	高速モード単価	標準比
Opus 4.8	$10 / $50（100万トークン）	2倍
Opus 4.6・4.7	$30 / $150（100万トークン）	6倍

旧Opusの高速モードは6倍とかなり割高。4.8で一気に下がった。締切前の「とにかく速く」という場面以外、普段使いするものじゃない。

subagent（子エージェント）をHaikuにする

Claude Codeは調査などを子エージェント（subagent）に並列で投げられる。このとき子エージェントだけHaikuに指定できる。

今回この記事のリサーチで実際に使ったワザがこれだ。「親＝Opus 4.8で全体を統括、子＝Haikuで情報を並列リサーチ」という構成にした。HaikuはOpusの5分の1の単価なので、調べ物みたいな単純作業を大量にやらせても安い。考える仕事は親、足で稼ぐ仕事は子、という分け方。

リサーチ系をゼロトークン気味に回す発想はNotebookLM×Claudeでゼロトークンの記事とも相性がいい。

週末SEの実際の使い分け（3つの結論）

通常の使い分け

長くなったので、自分が実際に落ち着いた設定を3つにまとめる。

1. まずeffortを作業の重さに合わせる。 朝のタスク確認や短い質問はLow、コードを書かせるときだけMedium〜High。ここが一番コストに効くレバー。

2. モデルは「重さ」で選ぶ。最新かどうかは二の次。 重いコード作業はOpus 4.8、日常はSonnet 4.6、単純作業はHaiku 4.5。4.7だけはトークナイザー膨張があるので、あえて選ぶ理由は薄い。

3. 調べ物はsubagent＋Haikuに逃がす。 親で抱え込まず、リサーチは安い子に並列で投げる。

Low固定で使っている人はここを変えるだけでいい

「effortはずっとLowで、大規模な開発作業はしない」という人は、effortレバーがすでに最適化済み。次に効くのはモデルを下げることだ。

作業	おすすめ設定
タスク確認・要約・整形・短い質問	Haiku 4.5 + Low
記事の相談・文章作成・軽いコード	Sonnet 4.6 + Low
たまの難しい判断・設計の壁打ち	Opus 4.8 + Medium（このときだけ上げる）

Opus固定のままLowで使い続けているなら、SonnetかHaikuに落とした瞬間に単価が1/3〜1/5になる。しかもSonnet・Haikuには4.7のトークナイザー膨張問題がないので、軽作業ほど二重に得。「下げておいて、難しいときだけ上げる」が基本戦略になる。

「最新にすれば安心」でも「旧モデルが得」でもなく、作業ごとに設定を合わせるのが一番安くて速い。週末しか触らない身ほど、この一手間が効く。

SVGを使ったClaudeとの作業効率化についてはClaude×SVGで試験範囲を可視化にもまとめている。

設定まわりをもう一段安全にしたいなら、Anthropic公式のセキュリティプラグインも入れておくといい。Claude Code公式セキュリティプラグインを導入した話に手順をまとめた。

effortやモデルの使い分けは触りながら覚えるのが一番だが、生成AIの使い方そのものを基礎から体系立てて固めたいなら、Udemyの生成AI・Claude活用講座も手堅い。セール時なら1講座1,500円前後の買い切りで、土台を一気に押さえられる。

▶ Udemyで生成AI・Claude活用の講座を探す（不定期セールで最大90%オフ・買い切り型）