GoogleのNotebookLMを開き、新しいノートブックを作成します。今回はAPEXとGeminiというノートブックを作成しました。
https://apexugj.blogspot.com/2023/12/web-credential-for-google-gemini-api.html?m=1
ソースガイドとして記事の概要が印刷されます。この他にも記事を取り込んでみましたが、驚くほど適切な概要になっています。ただし、記事にはGithub Gistのスニペットを埋め込んでいるのですが、それはソースとして取り込まれていません。
記事に貼り付けてあるスニペットもソースに取り込むために、モバイル向けのWebページをPDFに印刷し、PDFをソースとしてアップロードします。
PDFとしてアップロードすると、スニペットもソースに含まれます。
人間が読みやすいようにコードに行番号を表示していますが、AIに読ませることを考えると行番号は無い方がいい気がしています。
以下の6つの記事をソースとしてアップロードしました。
以下の質問をしました。
おおむね適切な回答になっています。
記事を探して読んで、該当する部分を自分で見つけるよりも、とにかくソースとしてPDFをアップロードして質問する方がはるかに効率が良い感じがします。
ソースコードを書いてください、という質問は、ソースにコードが含まれていても受け付けないか、記事の書き方か質問の仕方か、もしくはその双方の検討が必要そうです。
それでも回答は、そのコードに近い部分を引用しています。
NotebookLMのSourcesのLimitationsとして「Each source can contain up to 500,000 words. We’ll review these limits periodically to help determine the best user experiences」とあり、1ソースあたり50万語(日本語ほぼ50万文字になるかもしれません)、数の上限は50(公式のドキュメントに該当する記載を見つけられなかったので、もしかしたらワード数のみが制限になった可能性はあります)とのことです。
ノートブックを作成し、記事をソースとしてアップロードするには相応の手間がかかります。相当に有用な印象を受けましたが、現時点ではGoogle NotebookLMは試験期間中で費用は発生しないので、費用対効果は分かりません。OpenAIのRetrievalで同じことができる、または、その他のフレームワークでも同じことはできる、というのはありますが、アプリケーションを作らず、単にファイルをアップロードするだけ、というのはアドバンテージがあります。
とにかく、本ブログの記事以外に、マニュアルやWebページをノートブックのソースとしてアップロードして、チャットで質問して問題を解決する、というのが現実的な手段になったと言えそうです。
完