Claudeで300時間分の文字起こしデータから言及している本をすべて見つけてきた
🚀言いなりにならずに丸投げするバランスを見極める
4月からちょっとずつ取り組んでいた「ブックカタリストで言及した本を整理するプロジェクト」だいたい完了して、これまでの約140回の配信で触れた本(ほぼ)すべてのリスト&セールチェックページ、というのができ上がりました。
実際は、4月からやってたっていっても、何回も失敗して作り直していただけで、最終的には最後の2週間くらいで一気に完成させた、というイメージです。
って言うか、本の数カ月前のことなんだけど、当時の自分が作ってたものは、設計なりなんなりがとにかく貧弱で、質が低い。この2週間くらいのことを逆の目線で振り返ると、この数ヶ月でAIに指示を出す能力がめちゃくちゃ向上したんだなあ、と自己満足に浸ることもできました。
実際にどんなことをやったのか、どんなふうにまとめたか。そこから得られたものはなにか。いろいろ整理してみたいと思います。
300時間分の文字起こし&書籍同定が完了
まず、実際に作ったページがこれ。
上の方に「今セールしてるやつ」を並べて、下にはどのエピソードでどの本に言及したのか、というのを並べています。(クリックで詳細がみられる)
見た目とか構造とかはめっちゃLLMっぽい感じではあるんだけど、そういう事は今回は置いときましょう。
今回特に重要なのは、生成AI時代において重要なのは「整理」ではなく「記録」であるという、きわめて普通なことを、身にしみて思い知ることが出来た、という身にしみて普通の話です。
2020年末から6年くらいつづいているPodcast140回分。総時間数にして大ざっぱに300時間。(1回の目安時間が、本編1時間+おまけ1時間)
これだけ喋った分すべてを掘り返して、そこでどんな本について語っていたのか。
これをただ「整理してくれ」と言われたら、人間が飲まず食わずで24時間作業しても終わらない。(しかも楽しくない)
人間がやったら精神的に死ぬ仕事を、ローカルの文字起こしツール(Whisper)と、生成AIを使うことで、これらの作業をほぼ完全に自動化できた。
15年以上整理を生き甲斐にして生きてきた自分にとっては、生成AIのなにが嬉しいっていうと、こういう「不可能ではないけど自分でやったら死ぬ整理」が、現実的な作業量で完成させられるようになった、ということなんですよ。
もちろん「整理の仕組みを考える」とか「整理の仕組みを実装する」という行為には知恵と時間とエネルギーが必要なので、何でもかんでも簡単にできる、というわけではないけれども、少なくとも「知恵」に関しては、やりながら学んで、スキルとして上達させていくことが出来る。
少なくとも、数カ月前の俺が作ったやつは(コードをみなくても、構造をみるだけで)ヘタクソだということがよくわかる。何回も「なおらねえ」って苦労してたのは、結局自分のスキルが足りなくて、設計が甘くて、無駄に何回もなおすしかない状態を自ら生み出していた。
スキルとノウハウなので練習は必要
こうやって自分で「整理」してみて改めて思うんですが、この整理のテクニックって、一部は言語化して伝えることはできるんだけど、やっぱり「やらんとわからん」こともめちゃくちゃいっぱい存在しているんですよね。
知ってたらすぐにわかるようになる、できるようになることはいっぱいあるけど、それだけじゃない。「知識や経験から生まれる勘」とも言えるような、メタレベルでのLLMの挙動の理解、みたいなやつもいっぱいある。
言語を通してやりとりをする生成AIを相手にしているんだけれども、言語だけでは表現できない「付きあい方のコツ」みたいなものがある
もちろんナレッジスタックはそういう「コツ」を可能な限り言語にして伝えるっていうのが目標の1つではあるんだけど、言語として整理できない部分は絶対にある、というのもきちんと伝えなければ誠実ではないとも思う。
戻ってくるのは「いかに記録を残すか」
ただ、もう一回めっちゃ普通な話に戻ってくるんですが、今回のこのブックカタリストで紹介した本 | ごりゅご.comの中で、結局一番重要なのは「ちゃんと記録が残っている」ということだけなんですよね。
今回、きちんと手元にデータがなかったりもしたんだけど、それも「公開」してるおかげで、自分で音声ファイルを集めてくることが出来た。
それさえあれば、極論あとはもうどうにでもなるんですよね。
ブックカタリストの文字起こしができたのは、きちんとブックカタリストという形で「記録」を残していたから。
このナレッジスタックっていうニュースレターも広義での記録であって、自分がどういうことを考えてどういうことをしてきたかをきちんとテキストとして残しておいたもの。これさえあれば、あとはそれを生成AIを使って整理することはできる。これを使って次なるコンテンツだとか、思考の整理なんかに活用することが出来る。
まぁめっちゃ雑なまとめをしてしまえば、結局皆さん記録を残しましょう。その手段としてニュースレターだったり、podcastだったり何だったりっていうのをやっておくと、役に立つ事はめっちゃ多い。よって言うのが最終的な結論になるかな。
自分らしさを見つける、自分なりの楽しみ方を見つける。そういう時に、改めて「記録の重要性」というのは今まで以上に重要になってくるという、きわめて普通の、きわめて重要なことを改めて思い知った出来事でした。
具体的にやったこと
後はおまけとしてテクニックノーハウってほどではないんだけれども、実際にこのブックカタリストで言及した本を見つけるためにどんなことをやったのか、できるだけある程度詳細にテクニック、知識活用した手法などを最後にまとめておきます。
おそらくコツは「生成AIの言いなりにならず、でも同時に出来る限りの丸投げをする」こと。
この「バランス」というのが、おそらく自分が「言語化しづらい」といっている部分なんじゃないかな、と思います。


