ジャーナル制作で僕がやっていることを2,445件の発言から分析した

🎧 この記事を音声で聴く（4:26）

以前の記事で、僕は1本のコンテンツ制作における68件の判断ポイントを分析しました。「人間の仕事の44%は品質判断だった」と結論づけた記事です。

あれから半月。ふと思ったんですよね。

1本の分析じゃなくて、全部のセッションを分析したら何が見えるんだろう。

2,445件のデータ

Claude Codeには会話ログがJSONLファイルとして保存されています。ジャーナルを書き始めた3月初旬から今日まで、87セッション分のログが溜まっていました。

そこからジャーナル制作に関わるセッションだけを抽出するスクリプトを書きました。結果、41セッション・2,445件のユーザー発言が取れた。

「ユーザー発言」というのは、僕がClaude Codeに対して打ったメッセージのことです。つまり、2,445回、僕は何かを判断して言葉にしたということ。

僕は何を言っていたのか

2,445件の発言を分類すると、こうなりました。

分類	発言数	割合
修正指示	431	17.6%
質問	393	16.1%
承認	267	10.9%
指示	242	9.9%
情報提供	129	5.3%
判断	55	2.2%
フィードバック	30	1.2%
未分類	898	36.7%

一番多いのは修正指示（17.6%）。「ここを変えて」「読みが違う」「表形式にして」。次が質問（16.1%）。「これってどうなってますか」「可能ですか」。

つまり、僕の仕事の3分の1は「違う」と言うことと「どうなっている」と聞くことです。

どの工程で言っていたのか

同じデータを工程別に切ると、風景が変わります。

工程	発言数	割合
デプロイ	269	11.0%
Instagram	211	8.6%
音声	206	8.4%
リサーチ	132	5.4%
レビュー・修正	118	4.8%
記事執筆	88	3.6%
サイト構築	58	2.4%
パイプライン改善	50	2.0%

意外だったのは、記事を書く工程（3.6%）よりも、音声の品質チェック（8.4%）やInstagramの制作（8.6%）の方が人間の介入が多いということ。

記事の本文はClaude Codeが書いて、僕がレビューして数回修正すれば仕上がる。でも音声は「読みが違う」「括弧が読まれている」「中国語読みになった」と、聴いては直しの繰り返しになる。

前回の記事との比較

前回は音声・動画パイプラインの1本分を分析しました。今回はテキスト・ジャーナル制作の全セッションを分析しました。

	前回（1本の深掘り）	今回（41セッションの定量分析）
データ	68件の判断ポイント	2,445件のユーザー発言
人間の仕事の本質	品質判断（44%）、方向性決定（37%）	修正指示（17.6%）、質問（16.1%）
一番時間がかかる工程	音声チェック	音声（8.4%）+ Instagram（8.6%）

共通して見えるのは、「音声」が人間の介入を最も必要とする工程だということです。

前回は「聞いて、見て、違和感を伝える」と書きました。今回の2,445件のデータでも、音声工程の発言は「〜と読まれている」「〜は〜ですね」という読みの指摘が大半を占めています。テキストは目で確認できる。でも音声は耳で聴かないとわからない。だから人間の介入が集中する。

数字が語ること

2,445件の発言を改めて眺めると、ひとつ気づくことがあります。

僕は一度も「コードを書いてくれ」と言っていない。

deploy.pyの修正、generate_audio.pyの改善、reading_map.csvへの追記、Remotionのビルド。これらは全てClaude Codeが書いて、僕は結果を確認している。

僕が言っているのは、「違う」「こうして」「OK」「なぜ」。

AIAgenteerの記事で書いた通り、AIAgenteerは「コードを書く人」ではなく「AIに何を作らせるかを決める人」。2,445件のデータは、その定義をそのまま裏付けています。

前回の記事で「ソロのエージェントチームは育てるもの」と書きましたが、この2,445件の発言こそが「育てる」行為の実態です。修正指示を出し、質問で理解を確認し、承認でGOサインを出す。その繰り返しの中で、環境が少しずつ賢くなっていく。

まとめ

– 87セッション・2,445件のユーザー発言をスクリプトで定量分析した
– 僕の仕事の3分の1は「修正指示」と「質問」。コードは一行も書いていない
– 音声工程が最も人間の介入を必要とする。耳でしか確認できないから
– 前回の「68件の深掘り」と今回の「2,445件の定量分析」で、同じ結論に至った — 人間の仕事は上流（品質判断・方向性決定）に集中している

2,445件の「違う」と「OK」と「なぜ」。それが、僕のジャーナル制作における仕事の全てでした。

FAQ

なぜ「記事執筆」の割合が低いのか？

Claude Codeが過去記事を読み込み、文体・トーンを合わせてドラフトを書くため、人間の介入は方向性の指示と数回の修正で済みます。一方、音声やInstagramは品質を人間の感覚で確認する必要があり、介入回数が増えます。

「修正指示」と「指示」の違いは？

「指示」は新しいタスクの開始（「記事を書いて」「デプロイして」）。「修正指示」は既にある出力への変更要求（「ここを表形式に」「読みが違う」）。AIの出力が最初から完璧なら修正指示はゼロになるはずですが、17.6%を占めています。

未分類の36.7%は何？

思考中のつぶやき（「うーん…」「なるほど…」）や、複数の工程にまたがる発言、ジャーナル以外のプロジェクトの話題が混在しています。キーワードベースの自動分類の限界で、手動で精査すればさらに精度は上がります。

この記事が参考になったら