NotebookLMの音声解説を使って遊んでいます。
最初はGeminiにプロンプト書いて台本を作らせてからNotebookLMに投げていたのですが、PodCast番組の音声ファイルを生成する際に脚色と喋り台本をこちら側のAIが行っていますし、特に意識して台本を用意しなくても問題ないことにはすぐ気付きました。
最初はGeminiにプロンプト書いて台本を作らせてからNotebookLMに投げていたのですが、PodCast番組の音声ファイルを生成する際に脚色と喋り台本をこちら側のAIが行っていますし、特に意識して台本を用意しなくても問題ないことにはすぐ気付きました。
1 試しに台本を考慮しないテキストの塊を投げてみる
そこで、先日Quoraで書いていた【2024年、"メタバース"は「終わった」のでしょうか?「始まってすらいない」のでしょうか?】という質問への回答文をそのまま流し込んでみました。
この質問自体は2024年7月3日にあげられたもので既に旬を過ぎていて質問の注目度(アクセス)も下がっているものですが、SLユーザー的に回答可能な質問だったので一応投稿しておいたものです。
幸いQuoraに投稿していたこの回答の文字数は5760文字あるので「要素」は十分。
それで作られた音声ファイルがこれです。
多少漢字の読み間違いはありますが、概ねQuoraで回答した内容そのものを(変な改変なしに)会話風にアレンジした内容になっています。
尚、喋り台本作る際にAIらしく元テキストの主張を(ちゃんと調べて)補強してくれているので内容的に文句なしの仕上がりになっています。
2 個人の嗜好を書き綴っただけのテキストからは何ができる?
柔軟性あることもわかったので、今度は別パターンも作ってみました。
これもQuoraで見つけた【SONY信者とApple信者って同列ですか?】という質問の回答をそのままNotebookLMに流してみました。
これもQuoraで見つけた【SONY信者とApple信者って同列ですか?】という質問の回答をそのままNotebookLMに流してみました。
これは技術的な話は一切なく、ごく個人的な嗜好をただ書き綴っただけの内容ですけれど、NotebookLMのAIがどう脚色してくれたのかが分かりやすいです。
3 本当はURLのみでも良い
QuoraはAIからの読み込みをブロックするため、上の2つの例ではいちいちテキストをコピペしていますが、そういうブロックがないサイトにある情報だったらソースとしてurlを提出するだけでOKです。
尚、ブロックされていてもそのページを一旦pdf保存して、NotebookLMへのソースにそのpdfを渡せば回避できます。
次の例は一旦pdf保存して、それをNotebookLMに読み込ませています。
ページを丸ごとpdfしたものをソースにしているため画像も一緒に読み込ませてることになりますが、NotebookLMは画像解析も行なうため、画像の内容によってはちゃんと喋り内容に反映されます。
0 件のコメント:
コメントを投稿