この記事でわかること

結論から言うと、Claude Codeはモデルを変えるより先に「effort(工数)設定」を見直した方が財布に効く。同じ依頼でもLowとMaxで消費トークンが最大10倍変わるから。この記事ではOpus 4.6/4.7/4.8の違い、effortの仕組み、高速モードやsubagentでの節約ワザまで、週末SEの自分が実際に使ってる設定を全部出す。

目次

記事概要図

トークン代を決める3つのレバー ① effort設定 Low ⇄ Max で最大10倍 効果:大 まず最初に見る ② モデル選択 Haiku/Sonnet/Opus 単価が1:3:5 効果:中〜大 作業の重さで選ぶ ③ subagent 親Opus + 子Haiku 調査を安く並列 効果:中 リサーチ系で効く

週末SEがトークン代にビビった話

正直に言うと、自分はずっと「最新が4.7なら、旧モデルの4.6の方が安いやろ」と思って4.6を使い続けてた。旧バージョン=割引、みたいな感覚。会社員で週末しか触らない身からすると、月の利用枠は地味に気になるんだよね。

で、今回ちゃんと調べたら、この思い込みは半分だけ当たってて半分間違ってた。しかもそれ以前に、モデルより先に見るべき設定を完全に見落としてた。それがeffortだった。

effortって何?トークン代が10倍変わる仕組み

effort(工数)は、Claudeが答える前にどれだけ「考える」かを決めるツマミ。Claude Codeでは画面右下のモデル名の横から切り替えられる。

レベル中身トークン消費
Low単純な質問・軽作業。ほぼ考えずに即答最小
Medium日常的なコーディング
High複雑な推論。Opus 4.8の標準はここ
Max最難問題・コスト度外視最大

※Opus 4.7以降は「High」と「Max」の間に「xhigh」も追加されている。

ポイントは、この「考える」ぶんのトークン(思考トークン)が、出力と同じ単価で課金されること。だからツマミを上げるほど、回答1回あたりの金額がそのまま膨らむ。

公式ドキュメントや実測レポートいわく、同じ依頼でもLowとMaxで消費トークンが10倍以上変わることがある。ただしこれは固定の倍率ではなく、タスクの複雑さに依存する。軽い作業ほど差が開きやすい。

逆に言えば、「ファイル名を直して」レベルの作業にMaxを使うのは、タクシーで隣のコンビニに行くようなもの。まずeffortを作業の重さに合わせる。これが一番効くレバーだ。

4.6・4.7・4.8、結局どれを使えばいい?

冒頭の思い込みの答え合わせをする。

まず単価は3バージョンとも同じ。 旧モデル割引は存在しない。

モデル入力(100万トークン)出力(100万トークン)
Haiku 4.5$1$5
Sonnet 4.6$3$15
Opus 4.6 / 4.7 / 4.8$5$25

じゃあ「4.6の方が安い」は完全な間違いかというと、そうでもない。Opus 4.7から新しいトークナイザーが導入されて、同じ文章でも最大35%多くトークンを消費するようになった。4.8もこのトークナイザーを引き継いでいる。単価が同じでも、同じ文章なら4.6の方が消費トークンは少ない。「4.6を使い続けていた自分」は、短いやり取りについては結果的に正解だったわけだ。

ただし新しいモデルには明確な強みもある。

ベンチマークOpus 4.7Opus 4.8
SWE-bench Pro(コード実装)64.3%69.2%
SWE-bench Verified87.6%88.6%
USAMO 2026(数学)69.3%96.7%

4.8の目玉は数学推論が96.7%まで跳ねたことと、自分のコードの欠陥を見逃す確率が4分の1になったこと。さらに4.8は「少ない手数でタスクを終える」方向で最適化されている。

整理するとこうなる。

  • 複数ステップのコード作業(生成・大きめリファクタ)→ 手数が減るぶん最新の4.8が結果的に得
  • 短い会話・単純作業の繰り返し→ トークナイザー膨張がそのまま効くので、最新が必ず得とは言えない。それよりeffortをLowに下げる方が効く

effort以外の節約ワザ(高速モードとsubagent)

高速モード(/fast)

/fast で切り替えるとOpusが2.5倍速くなる。中身は同じモデルで、インフラ側で速度優先にしているだけ。品質は変わらない。ただし課金が上がる。バージョンで割増率が大きく違う点に注意。

モデル高速モード単価標準比
Opus 4.8$10 / $50(100万トークン)2倍
Opus 4.6・4.7$30 / $150(100万トークン)6倍

旧Opusの高速モードは6倍とかなり割高。4.8で一気に下がった。締切前の「とにかく速く」という場面以外、普段使いするものじゃない。

subagent(子エージェント)をHaikuにする

Claude Codeは調査などを子エージェント(subagent)に並列で投げられる。このとき子エージェントだけHaikuに指定できる。

今回この記事のリサーチで実際に使ったワザがこれだ。「親=Opus 4.8で全体を統括、子=Haikuで情報を並列リサーチ」という構成にした。HaikuはOpusの5分の1の単価なので、調べ物みたいな単純作業を大量にやらせても安い。考える仕事は親、足で稼ぐ仕事は子、という分け方。

リサーチ系をゼロトークン気味に回す発想はNotebookLM×Claudeでゼロトークンの記事とも相性がいい。

週末SEの実際の使い分け(3つの結論)

通常の使い分け

長くなったので、自分が実際に落ち着いた設定を3つにまとめる。

1. まずeffortを作業の重さに合わせる。 朝のタスク確認や短い質問はLow、コードを書かせるときだけMedium〜High。ここが一番コストに効くレバー。

2. モデルは「重さ」で選ぶ。最新かどうかは二の次。 重いコード作業はOpus 4.8、日常はSonnet 4.6、単純作業はHaiku 4.5。4.7だけはトークナイザー膨張があるので、あえて選ぶ理由は薄い。

3. 調べ物はsubagent+Haikuに逃がす。 親で抱え込まず、リサーチは安い子に並列で投げる。

Low固定で使っている人はここを変えるだけでいい

「effortはずっとLowで、大規模な開発作業はしない」という人は、effortレバーがすでに最適化済み。次に効くのはモデルを下げることだ。

作業おすすめ設定
タスク確認・要約・整形・短い質問Haiku 4.5 + Low
記事の相談・文章作成・軽いコードSonnet 4.6 + Low
たまの難しい判断・設計の壁打ちOpus 4.8 + Medium(このときだけ上げる)

Opus固定のままLowで使い続けているなら、SonnetかHaikuに落とした瞬間に単価が1/3〜1/5になる。しかもSonnet・Haikuには4.7のトークナイザー膨張問題がないので、軽作業ほど二重に得。「下げておいて、難しいときだけ上げる」が基本戦略になる。

「最新にすれば安心」でも「旧モデルが得」でもなく、作業ごとに設定を合わせるのが一番安くて速い。週末しか触らない身ほど、この一手間が効く。

SVGを使ったClaudeとの作業効率化についてはClaude×SVGで試験範囲を可視化にもまとめている。

設定まわりをもう一段安全にしたいなら、Anthropic公式のセキュリティプラグインも入れておくといい。Claude Code公式セキュリティプラグインを導入した話に手順をまとめた。