実験のつもりが、完璧を目指していた話
note の記事を 30 秒の動画にしてくれる仕組みを、試してみた日のことです。
URL を渡すだけで動画ができるという話が面白そうで、自分の記事を渡してみました。
少し待つと、縦型の 30 秒動画が出てきました。
再生してみたら、ナレーションが日本語に聞こえないくらい崩れていて、これはこれで発見でした。
私はもともと、自分の声で読み上げてくれる別の仕組み(Voicebox)を持っているので、ナレーションだけ差し替えてみようと思いました。
ここからが、長い往復の始まりでした。
5 回作り直しました
差し替えるためには、6 つの場面(ビート)に分かれているナレーションを、それぞれ別に作り直して、もとの動画のタイミングに合わせて並べる必要がありました。
最初の 1 回目では、「6 回」が「ろくかい」と読まれてしまいました。
直しました。
2 回目では、「7 回目」が「なっなかいめ」と変な分節で読まれました。
直しました。
3 回目では、「通った」が「とよった」になりました。
直しました。
4 回目では、別の場所が切れていました。
直しました。
5 回目で、ようやく動画ができました。
ボタンを押した方が早かったかもしれません

途中で、Voicebox のアプリ画面(UI)を開いてみたんです。
そうしたら、私が自分で「再生成」ボタンを 1 回だけ押していた音声が、履歴に残っていました。
その音声は、CLI で 5 往復した私の苦労を 1 クリックで超えて、ちゃんと自然に読まれていました。
何のために始めたか、忘れていました

そもそも今回やっていたのは、比較実験でした。
「URL を渡すだけで動画になる仕組み」と、「自分の手で動画を作る方法」。
両方を試して、何がどう違うかを並べてみるのが目的でした。
最初の動画ができた時点で、実験としては結論が出ていました。
ナレーションが崩れること、差し替えれば何とかなること。
それで十分だったんです。
なのに私は、ナレーションを完璧に直そうとしていました。
「もっと短くなるはず」
「この読み間違いが直るはず」
「ここのタイミングが合うはず」
そうやって、ボタン 1 つで終わることに、5 回も往復してしまいました。
完璧を目指したくなる癖

これは私の癖だなと、書いていて思いました。
何かを始めると、つい完璧を目指したくなります。
実験のつもりが、完成品作りに変わってしまう。
比較のつもりが、最高傑作作りに変わってしまう。
試しに作っただけのものを、つい磨きたくなってしまう。
最初に決めた「ここまでやれば終わり」のラインを、自分で勝手に上げてしまいます。
GUI を作っている理由を、再確認しました

私はいま、YouTube の動画を作るための GUI エディタを、自分用に作っています。
なんで作っているかというと、AI に細かい調整を指示するより、自分で画面を操作する方が早いからなんです。
「ここをちょっと下げて」
「色を少し明るく」
「タイミングを 0.5 秒前に」
こういうのは、文字で伝えるより、自分の指でつまんで動かす方が、5 倍くらい早いと感じています。
そう信じて GUI を作っているのに、TTS の微調整は CLI でやっていました。
動画と TTS は別物だと、無意識に思い込んでいたみたいです。
実際には、同じ「微調整」というカテゴリでした。
次に同じ場面に出会ったとき

私は、何度でもこの罠に落ちる気がしています。
実験を始めると、結論が出てもやめられない。
試作品を作ると、磨きたくなる。
1 行直すために、5 行のスクリプトを書いてしまう。
それでも、今回みたいに途中で「あれ、もったいないな」と気づけるなら、まだ大丈夫かもしれません。
ボタン 1 つで終わることに、5 回往復しないために。
微調整は GUI、量産は AI。
最初に決めたゴールを、自分で勝手に動かさない。
そんなことを、今日の動画作りで学んだ気がします。

