この記事でわかること
結論から言うと、Claude Codeはモデルを変えるより先に「effort(工数)設定」を見直した方が財布に効く。同じ依頼でもLowとMaxで消費トークンが最大10倍変わるから。この記事ではOpus 4.6/4.7/4.8の違い、effortの仕組み、高速モードやsubagentでの節約ワザまで、週末SEの自分が実際に使ってる設定を全部出す。
目次
記事概要図
週末SEがトークン代にビビった話
正直に言うと、自分はずっと「最新が4.7なら、旧モデルの4.6の方が安いやろ」と思って4.6を使い続けてた。旧バージョン=割引、みたいな感覚。会社員で週末しか触らない身からすると、月の利用枠は地味に気になるんだよね。
で、今回ちゃんと調べたら、この思い込みは半分だけ当たってて半分間違ってた。しかもそれ以前に、モデルより先に見るべき設定を完全に見落としてた。それがeffortだった。
effortって何?トークン代が10倍変わる仕組み
effort(工数)は、Claudeが答える前にどれだけ「考える」かを決めるツマミ。Claude Codeでは画面右下のモデル名の横から切り替えられる。
| レベル | 中身 | トークン消費 |
|---|---|---|
| Low | 単純な質問・軽作業。ほぼ考えずに即答 | 最小 |
| Medium | 日常的なコーディング | 中 |
| High | 複雑な推論。Opus 4.8の標準はここ | 多 |
| Max | 最難問題・コスト度外視 | 最大 |
※Opus 4.7以降は「High」と「Max」の間に「xhigh」も追加されている。
ポイントは、この「考える」ぶんのトークン(思考トークン)が、出力と同じ単価で課金されること。だからツマミを上げるほど、回答1回あたりの金額がそのまま膨らむ。
公式ドキュメントや実測レポートいわく、同じ依頼でもLowとMaxで消費トークンが10倍以上変わることがある。ただしこれは固定の倍率ではなく、タスクの複雑さに依存する。軽い作業ほど差が開きやすい。
逆に言えば、「ファイル名を直して」レベルの作業にMaxを使うのは、タクシーで隣のコンビニに行くようなもの。まずeffortを作業の重さに合わせる。これが一番効くレバーだ。
4.6・4.7・4.8、結局どれを使えばいい?
冒頭の思い込みの答え合わせをする。
まず単価は3バージョンとも同じ。 旧モデル割引は存在しない。
| モデル | 入力(100万トークン) | 出力(100万トークン) |
|---|---|---|
| Haiku 4.5 | $1 | $5 |
| Sonnet 4.6 | $3 | $15 |
| Opus 4.6 / 4.7 / 4.8 | $5 | $25 |
じゃあ「4.6の方が安い」は完全な間違いかというと、そうでもない。Opus 4.7から新しいトークナイザーが導入されて、同じ文章でも最大35%多くトークンを消費するようになった。4.8もこのトークナイザーを引き継いでいる。単価が同じでも、同じ文章なら4.6の方が消費トークンは少ない。「4.6を使い続けていた自分」は、短いやり取りについては結果的に正解だったわけだ。
ただし新しいモデルには明確な強みもある。
| ベンチマーク | Opus 4.7 | Opus 4.8 |
|---|---|---|
| SWE-bench Pro(コード実装) | 64.3% | 69.2% |
| SWE-bench Verified | 87.6% | 88.6% |
| USAMO 2026(数学) | 69.3% | 96.7% |
4.8の目玉は数学推論が96.7%まで跳ねたことと、自分のコードの欠陥を見逃す確率が4分の1になったこと。さらに4.8は「少ない手数でタスクを終える」方向で最適化されている。
整理するとこうなる。
- 複数ステップのコード作業(生成・大きめリファクタ)→ 手数が減るぶん最新の4.8が結果的に得
- 短い会話・単純作業の繰り返し→ トークナイザー膨張がそのまま効くので、最新が必ず得とは言えない。それよりeffortをLowに下げる方が効く
effort以外の節約ワザ(高速モードとsubagent)
高速モード(/fast)
/fast で切り替えるとOpusが2.5倍速くなる。中身は同じモデルで、インフラ側で速度優先にしているだけ。品質は変わらない。ただし課金が上がる。バージョンで割増率が大きく違う点に注意。
| モデル | 高速モード単価 | 標準比 |
|---|---|---|
| Opus 4.8 | $10 / $50(100万トークン) | 2倍 |
| Opus 4.6・4.7 | $30 / $150(100万トークン) | 6倍 |
旧Opusの高速モードは6倍とかなり割高。4.8で一気に下がった。締切前の「とにかく速く」という場面以外、普段使いするものじゃない。
subagent(子エージェント)をHaikuにする
Claude Codeは調査などを子エージェント(subagent)に並列で投げられる。このとき子エージェントだけHaikuに指定できる。
今回この記事のリサーチで実際に使ったワザがこれだ。「親=Opus 4.8で全体を統括、子=Haikuで情報を並列リサーチ」という構成にした。HaikuはOpusの5分の1の単価なので、調べ物みたいな単純作業を大量にやらせても安い。考える仕事は親、足で稼ぐ仕事は子、という分け方。
リサーチ系をゼロトークン気味に回す発想はNotebookLM×Claudeでゼロトークンの記事とも相性がいい。
週末SEの実際の使い分け(3つの結論)
通常の使い分け
長くなったので、自分が実際に落ち着いた設定を3つにまとめる。
1. まずeffortを作業の重さに合わせる。 朝のタスク確認や短い質問はLow、コードを書かせるときだけMedium〜High。ここが一番コストに効くレバー。
2. モデルは「重さ」で選ぶ。最新かどうかは二の次。 重いコード作業はOpus 4.8、日常はSonnet 4.6、単純作業はHaiku 4.5。4.7だけはトークナイザー膨張があるので、あえて選ぶ理由は薄い。
3. 調べ物はsubagent+Haikuに逃がす。 親で抱え込まず、リサーチは安い子に並列で投げる。
Low固定で使っている人はここを変えるだけでいい
「effortはずっとLowで、大規模な開発作業はしない」という人は、effortレバーがすでに最適化済み。次に効くのはモデルを下げることだ。
| 作業 | おすすめ設定 |
|---|---|
| タスク確認・要約・整形・短い質問 | Haiku 4.5 + Low |
| 記事の相談・文章作成・軽いコード | Sonnet 4.6 + Low |
| たまの難しい判断・設計の壁打ち | Opus 4.8 + Medium(このときだけ上げる) |
Opus固定のままLowで使い続けているなら、SonnetかHaikuに落とした瞬間に単価が1/3〜1/5になる。しかもSonnet・Haikuには4.7のトークナイザー膨張問題がないので、軽作業ほど二重に得。「下げておいて、難しいときだけ上げる」が基本戦略になる。
「最新にすれば安心」でも「旧モデルが得」でもなく、作業ごとに設定を合わせるのが一番安くて速い。週末しか触らない身ほど、この一手間が効く。
SVGを使ったClaudeとの作業効率化についてはClaude×SVGで試験範囲を可視化にもまとめている。
設定まわりをもう一段安全にしたいなら、Anthropic公式のセキュリティプラグインも入れておくといい。Claude Code公式セキュリティプラグインを導入した話に手順をまとめた。