ジャーナル50本を出して、初めて見えた個人運営者の世界 — AIと組んだ3ヶ月のスナップショット

🎧 この記事を音声で聴く（14:56）

※ この記事の音声版は edge-tts (Microsoft) で生成しています。息継ぎや疑問文の語尾など、人間の話し方と異なる箇所があります。

KaleidoFutureジャーナルを書き始めて、3ヶ月弱が経ちました。

2026年3月1日に最初の記事を出してから、5月22日の「AIに仕事を奪われる」の次にあるもっと地味なストレスで、通算50本目に到達しました。83日間です。

50本目を出したタイミングで、いったん手元の数字を全部並べてみることにしました。

「やってみたら見えた数字」を出すこと自体は、4月13日のジャーナル制作で僕がやっていることを分析したで、AIと僕の役割分担を測ったときに一度やっています。今回はそれとは違う角度で、ジャーナル本体の総量・方向・継続発信の条件を、自分なりに測り直してみる、というのが今日の主旨です。

数字を出してみて、「自分すごい」とはまったく逆の風景が見えました。「あ、こういう先達がいる世界の入り口に、AIをパートナーにしたことで、3ヶ月で自分も足を踏み入れることができたんだな」 という感覚です。今日は、その風景を、なるべくそのまま書いてみます。

50本を量で測ってみる

まず、純粋な数字から並べます。

項目	数字
通算本数	50本
期間	2026年3月1日〜5月22日（83日間）
平均ペース	1本あたり約1.7日
総文字数	約 367,553 字（FAQや括弧内補足を含む、HTMLコメントと空白を除いた値）
音声総時間	10時間32分44秒
1本平均字数	約 7,351 字
1本平均音声	12.7分

総文字数を原稿用紙400字詰めで換算すると、およそ920枚分。新書1冊が原稿用紙500〜700枚と言われる粒度感に当てはめると、新書1.3〜1.8冊分の文字量を、3ヶ月弱で発信できていた、ということになります。（新書の文字数換算は版型により幅があるので、出版社が標準として広く言及している範囲の数字を採用しています）

音声は、1本あたり平均12.7分のペースで全記事に音声プレイヤーが付いて、累計10時間半。休日に歩きながら朝から夜まで自分の過去記事を流し続ければ、ちょうど聴き切れる総量です。

正直に書いておくと、書き始めた3月初旬は「いつまで続くか分からない、6回くらいで力尽きるかもしれない」と思いながらスタートしていました。3ヶ月後にこの数字が並ぶ未来は、3月1日の自分には想像できていなかった。

数字を出してみて、初めて視野に入ってきた世界

ここからが、この記事を書こうと思った一番の動機です。

50本という数字を手にしてから、改めて 「個人で長文を出している人たち」 が世の中にどれくらいいるのか、軽く調べ直してみました。
（3並列のリサーチエージェントで「半年40万字級の個人ブロガー」「半年10時間級の自前音声配信」「文章+音声両刀の個人運営」を別々の角度で探した結果です）

その結果、僕がいままで視界に入れていなかった、こういう先達がいることが、初めて見えるようになりました。

人	拠点・職能	量・特徴	音声	僕との位置関係
Scott Alexander	米国 / 精神科医	Slate Star Codex 時代に1,500本超、PDF合計9,000ページ超、1本3,000〜15,000語級	第三者ナレーターによる朗読あり	量の桁が違う英語圏ロングフォームの代表格
Gwern Branwen	英語圏 / 独立リサーチャー	累計438万語（2022年11月時点）、年30万語級 × 14年	なし	量の桁が違う、AI・自己実験ジャンルの先達
finalvent	日本語圏	極東ブログ + note 二刀流、2003年〜、1本2,000〜5,000字級を年100本以上	なし	日本語圏ロングフォーム個人ブロガーの代表格
シロクマ（熊代亨）	日本語圏 / 精神科医	月10〜15本、1本2,000〜4,000字級の精神医学・社会論エッセイ	なし	ジャンル・粒度感の近い日本語圏の先達
Heather Cox Richardson	米国 / 歴史 × 政治分析	Substack 約290万購読、Podcast 764エピソード、ほぼ毎日更新	本人朗読	文章+音声両刀の超大規模個人運営の代表格
Adam Mastroianni	英語圏 / 心理学考察	隔週、1本14〜23分音声 × 年26本	本人朗読（Substack voiceover）	音声付き長文エッセイの粒度感がいちばん近い例

数字をきちんと並べると、量だけで言えばScott Alexander さん、Gwern Branwen さん、Heather Cox Richardson さんは、僕の遥か上にいる人たちです。年単位で見れば桁が違う。日本語圏ではfinalvent さんやシロクマさんが長年継続している先達で、音声付き長文エッセイの粒度感としてはAdam Mastroianni さんが、いちばん僕に近い例として浮上しました。

僕は3ヶ月で50本のスナップショットを撮っただけで、こうした方々と肩を並べたわけではありません。ただ、「こういう世界があるんだ」を視界に入れたうえで、これからの方向を考えられるようになった、という意味で、50本という数字を自分の手元に出したこと自体に意味がありました。

一方で、見つからなかったポジション

並列で同じリサーチを走らせたとき、もう一つ別の発見もありました。

「日本語圏 × ブログ+音声を同一コンテンツとして両刀運営 × 検証や分析ジャーナル系 × 自前TTSパイプライン」まで条件を絞ると、3並列のリサーチエージェントを走らせた今回の検索範囲では、直接の比較対象が特定できなかったんですよね。

英語圏ではAdam Mastroianni さんやTim Denning さんのように、Substack公式のvoiceover機能を使って自分の長文に音声を付けている方々が複数います。日本語圏でもVoicyやstand.fmで口述ベースの音声配信をしている方は多くいる。

ただ、「自分のブログ長文を、edge-ttsのような自前パイプラインを組んで、本人の肉声でもなく商用AI読み上げサービスでもなく、全記事自動音声化して同一コンテンツとして配信する」という座標は、今回のリサーチ範囲では英語圏でも日本語圏でも見つけられませんでした。

これは「自分が偉い」という話ではなく、「たまたま、まだ誰も埋めていない座標が、そこにある」 という観察です。盛らずに言えば、ゼロ件断定はできないけれど、検索で表に出てこないレベルでは希少な位置に、結果として立っている。

これが、視界に入った2つ目の風景でした。

結果としてこうなっていた — カテゴリ分布

設計してこうしたわけではなく、結果としてこういうカテゴリ分布になっていた、という観察です。

カテゴリ	本数	総文字数	平均字数
検証レポート	15本	94,153字	6,277字
リサーチノート	12本	108,652字	9,054字（最重量）
週刊AI動向	10本	82,581字	8,258字
AI業界分析	9本	60,320字	6,702字
コラム	4本	21,847字	5,462字

書きながら 「本数の比率」ばかり気にしていた のですが、文字数で見ると別の絵が浮かびました。

リサーチノートは本数2位なのに、総文字数では1位になっていますね。1本あたり平均9,054字で、最重量カテゴリです。心理学・行動経済学・教育学などの周辺領域から論文や調査を引いて、自分の経験と照らし合わせる、という型のリサーチノート系は、インプット行為としての密度が、そのまま字数に出る構造でした。書いているときの自分は単に「面白そう」で書いていただけなのに、結果として「インプットを量で出す」モードが浮上していた、と言えそうです。

週刊AI動向の平均8,258字も意外でした。週次のニュースまとめだから軽くなりそうなところを、メイントピックの考察を毎週掘っているうちに、結果としてリサーチノートに並ぶ重量になっていた、と見て取れます。

「書いた本数の比率」と「実際に出した文字数の比率」は、まったく別の像を描く、ということを、今回数字を並べて初めて気づきました。

累計10時間半の音声 — 歩きながら聴ける「自分の知識資産」

ここで、音声の話にフォーカスして書きます。

ジャーナル50本の音声総時間は、10時間32分44秒。1本あたり平均12.7分のペースで、全記事に edge-tts ベースの音声プレイヤーが付いています。

数字だけ見ると地味ですが、音声を発信側じゃなくて聴く側で並べ直すと、別の見え方が出ます。土曜の朝に散歩を始めて、夕方までずっと自分の過去記事を流し続ければ、ちょうど聴き切れる総量。「歩きながら、自分の3ヶ月分の考えを通しで聴ける」 くらいの規模になっていた、ということです。

これは、ジャーナル音声をジャーナルの外に持ち出すための土台でもあります。すでに別軸として、自前パイプラインの音声をポッドキャスト化するアイデア や、KaleidoFuture Japanese Labのほうで、日本語学習者向けシャドーイング教材へ横展開する検証を、内部で進めています。今日の本題からは外れるので深入りしませんが、「3ヶ月で10時間の素材を全記事分そろえてしまった」という事実が、その横展開を現実的なものにしてくれている、と言えそうです。

音声化が果たしている、もう一つの裏の役割

音声を「出力チャネル」として語ってきましたが、50本を運用してみて改めて言葉になったのは、音声化はもう一つ別の役割を、裏で担っていた、という観察です。今回の振り返りで、自分の中でいちばん大きい発見はここでした。

ジャーナル制作で音声生成スキップを検討した瞬間は、ゼロではありません。記事を書いて、読み辞書を整備して、音声を生成して、WordPressに音声プレイヤーを埋め込んで、ブラウザで実際に聴いてみる。一連の工程は、決して軽くない。

それでも、50本続けてみて、音声化を外す選択肢が一度も現実的にならなかった理由が、2レイヤーでようやく言葉になりました。

レイヤー1: 校正のレイヤー

書いた直後の自分の目で読み返すと、文章のリズムや論理の繋ぎ目の違和感は、案外見逃します。同じ文章を音声で読み上げてもらうと、目で読んでいたときは見えなかった粗が浮かび上がってくる。

具体的には、こんな現象が頻発しました。

– 同じ語が3行で4回出てくる、というしつこさが、音声で初めて目立つ
– 文末の「〜と思います。〜と感じます。〜と思いました。」の連打が、音声で聴くと露骨に間延びする
– 数字や略語の読み方を読み辞書に追加し忘れていて、機械音声が固有名詞を変な読みで通過するのが、音声化テストで初めて検出される
– 段落間の論理の飛びが、テキストでは「まあわかる」で済むものが、音声で聴くと「いま、なぜこの話に移ったんだ」と引っかかる

これらは、音声化を経由しないと出てこない、運用側の校正シグナルです。記事ごとに音声を聴くたびに、表現や構成の小さな修正がいくつも入る。回数を重ねるほど、この校正レイヤーが、僕にとって省略するとコストの方が大きい工程になっていきました。

レイヤー2: AIとの自己同一性のレイヤー

もう一つ、こちらは正直に言うと、ここまで意識化していなかった役割があります。

先日5月20日に書いた、「正解がある」と思って育った世代の壁で、「AIに聞くと、自分の言葉も似てくる」という体感や、「自分が薄まる連鎖」が僕自身の文章にも侵食していない保証はない、ということを書きました。50本振り返って、初めて音声化がそのフィルターを地味に担ってくれていたことに気づいたんですよね。

AIに支援してもらいながら記事を書くと、書いた直後の僕は、「これは僕の文章だ」と感じているのですが、それを音声で聴き直すと、「これは僕が話しそうな話の運び方か？」「僕がふだん使う言い回しか？」という、別の判定軸が走り始めるんです。

つまり、目で読む段階では「自分が書いた」ことになっている文章が、耳で聴く段階では「他人の文章」として外側から立ち上がってくることがある、ということ。聴いていて違和感が出る箇所が、AIに引っ張られて「自分とは少しずれた言い方」になっている、というシグナルになる。

これは、5月13日のAIを使うほど「読む力」が要るパラドックスで引用した、Maryanne Wolf の「バイリテラシー（Biliteracy）= 音声を介在させて深く読む」という議論の、実装側の運用解にもなっている、と整理できそうです。

「読む側」の問題として書いた話を、「自分で書いた文章を聴き直す側」の運用に裏返したら、AI支援で量産できるからこそ、音声を経由して自己同一性を測り直すフィルターが必要になっていた、という対称構造が見えてくる。

50本という量を出すと、書いた直後の「自分の文章」感覚は、量に比例して薄まっていきます。1日1本書く感覚に近づくほど、目で読み返す気力も摩耗していく。そんなとき、音声生成と再生を仕組みとして組み込んでおくと、自分の意志に依存しない形で、自己同一性のチェックが毎回入る。これが、効率化議論で削れない実装上の理由だ、と今日の振り返りで言葉になりました。

他領域への展開 — アウトプットを客観化する装置として

書きながら気づいたのは、この2つのレイヤーはジャーナル運用に固有の話ではなさそうだ、ということでした。

たとえば、こんな場面に同じ発想が転用できそうです。

– 営業のプレゼン資料や顧客提案を、本番前に自分で音声化して聴き返す
– 研修発表のスピーチ原稿を、登壇前に音声化してリハーサルする
– AIに支援してもらった提案書を、声に出して読み上げてもらってからクライアントに出す

どれも「自分のアウトプットを、自分と少し距離を取って客観化する装置」として、音声を介在させる発想がそのまま使えます。とくにAIに支援してもらって作ったアウトプットほど、この「他人として聴き直す」フィルターが効く、というのが今日の振り返りで言葉になった共通構造でした。読者の方の実業務にも、何かしら持ち帰れる部分がありそうな気がしています。

ジャーナルを「続けるための条件」を、外化しておく

50本到達というタイミングだからこそ、もう一つだけ書いておきたいことがあります。

50本続いてしまうと、「続けるべきもの感」 が自分の中で勝手に強くなっていく。ジャーナル運用が日常になりすぎて、本来撤退を検討すべきタイミングを見逃すリスクが生まれます。

そうなる前に、ジャーナル運用のKPIと撤退基準を、リポジトリ内のドキュメントとして3階建て＋3段階で定義しました。今日の振り返りで、要点だけ外化しておきます。

まず、健全性をチェックするTier 0 指標。記事を書く動機、所要時間、「やらなきゃ」感の3軸で見ます。

指標	撤退検討の条件
「面白そう」で書いた記事の比率	60%未満の月が、2ヶ月連続
1記事あたりの所要時間	6時間超の月が、2ヶ月連続
月3モヤカウント（「やらなきゃ」感の発生回数）	4以上の月が、2ヶ月連続

次に、ジャーナル自体の停止判断にあたる撤退基準 Lv.3。Tier 0 の連続違反、月3モヤの連続、他案件への重力の3つで判断します。

判断軸	Lv.3 発火条件
健全性指標の継続違反	Tier 0 の撤退ラインを、2ヶ月連続で踏んだ場合
「やらなきゃ感」の継続	月3モヤカウントが4以上で、2ヶ月連続
他案件への重力	「やりたい」が他案件で見えていて、ジャーナルが時間泥棒になっている自覚が出てきた場合

これは、「続けるための設計」ではなく「迎合を防ぐための設計」 です。続けることも目的ではありますが、副次効果（PV / 流入 / 営業効果）を主目的にした瞬間に、自分基軸が崩れる構造を持っているので、そうならないよう先に止め方を決めておく、というスタンス。Building in Publicとして、運用しながら数字を出していこうと思っています。

AIを相棒にして、踏み込めた範囲をスナップショットで残す

50本到達というタイミングで、量・方向・継続発信の3軸で測り直してみた結果として、いま手元に残っているのは次の3つの感覚です。

一つ目は、「これくらいの量を出してみると、自分がいる場所がようやく見えてくる」 ということ。Scott Alexander さん、Heather Cox Richardson さんのように先を走っている方々が「存在する」ということ自体、自分が量を出してみるまで視界に入っていませんでした。AIをパートナーにして3ヶ月50本まで踏み込んだから、その先達のいる風景がようやく見えた。

二つ目は、「日本語圏 × ブログ+音声両刀 × 検証ジャーナル系 × 自前TTSパイプライン」 という座標が、たまたままだ空白で、結果として立っているところに自分がいた、という観察。誰かに先行しているわけではなく、ただ、まだ誰も埋めていない座標がそこにあった、という淡々とした事実です。

三つ目は、量を出せるようになるほど、AIとの自己同一性を保つフィルターが必要になる、という運用上の発見。音声化は出力チャネルというより、AIとの距離を測り続けるための入力側フィルターとして機能していた。これは、量と継続発信を両立させるうえで、たぶん削れない工程です。

3ヶ月前の自分は、「いつまで続くか分からない、6回くらいで力尽きるかもしれない。けど、自分の何かになるかもしれない。」 と思いながら書き始めました。3ヶ月後の自分は、50本のスナップショットを撮って、その風景の中で 「次は何を試そう」 を考えている。

AIを相棒にして踏み込めた範囲は、今はここまで。次の50本でどこまで広がるかは、今日のスナップショットを基準にして、また同じ角度で測り直していこうと思います。

FAQ

この記事の総文字数 36.7万字は、no-audioブロックも含めて測っているんですか？

含めて測っています。本記事で「総文字数約36.7万字」として出している値は、本文・テーブル・no-audioブロック（括弧内補足・FAQ）を含めて、HTMLコメントと空白だけを除いた数字です。「音声で読み上げられるテキストの長さ」とは別の値で、こちらを別途集計すると約27.0万字でした。記事内で重要なのは「3ヶ月で自分がどれだけ思考を言葉にしたか」の総量なので、補足を含む数字をメインに置いています。

「自前TTSパイプライン両刀運営の希少性」は、誇張じゃないですか？

リサーチエージェントを3並列で走らせて確認した範囲では、英語圏で Heather Cox Richardson さん / Tim Denning さんが文章+音声両刀の代表例として見つかり、Adam Mastroianni さんが粒度感の近い例として浮上しました。ただし、いずれも肉声朗読 or Substack公式のvoiceover機能が中心で、edge-ttsのような自前パイプラインを組んで全記事を自動音声化している事例は、今回の検索範囲では英語圏でも特定できませんでした。日本語圏ではさらに見つからず、ここに座標が空いていることは事実そうです。一方で、検索範囲外にいる方は当然いらっしゃるはずなので、「ゼロ件断定はできない」と記事内にも明示しています。

KPIを「続けるための指標」ではなく「撤退基準」として置いている理由は？

ジャーナルは続けやすい構造を持っていて、本来見直すべきタイミングを見逃すリスクがある、と判断したからです。「面白そうで書いた比率」「1記事あたりの所要時間」「月3モヤカウント」のTier 0指標は、続いていても健全性が損なわれていたら撤退を検討するための基準。続けること自体を目的にすると、副次効果としてのPV / 流入 / 営業効果が主目的化して、自分基軸が崩れる構造を持っているので、その手前で止められる仕組みを先に置いておく、というスタンスです。

次の50本では、何を試しますか？

具体的には3つ考えています。1つ目は、音声側の横展開（ポッドキャスト / 日本語学習者向けシャドーイング教材）の検証を、ジャーナル本体の運用と並走させること。2つ目は、KFビジョン ver.C の「3〜5人分の成果を一人で出す」を、より定量的に測れる検証記事の積み上げ。3つ目は、本記事でも触れたKPI Tier 0〜3の数字を、月次でブログ上に外化していくBuilding in Publicの継続です。次の振り返りタイミングは100本到達時を想定しているので、おそらく2026年8月末あたり。そのときにまた、同じ角度でスナップショットを撮ろうと思っています。

この記事が参考になったら