2024年6月7日金曜日

Google NotebookLMにAPEXの日本語記事を読ませて質問してみる

Google NotebookLMが日本で利用できるようになったので、本ブログの記事を読ませて質問してみました。

GoogleのNotebookLMを開き、新しいノートブックを作成します。今回はAPEXとGeminiというノートブックを作成しました。


作成したノートブックにソースを追加します。ソースのプラス(+)アイコンをクリックし、アップロード元ウェブサイトを選びます。


記事「GoogleのGemini APIをOracle APEXから呼び出す」をソースに追加します。URLは以下です。URLの末尾に?m=1を追加し、モバイル向けの画面に切り替えます。この指定が無いと、画面の右にあるブログアーカイブ、関連サイト、ラベルといった情報もソースに取り込まれてしまいます。

https://apexugj.blogspot.com/2023/12/web-credential-for-google-gemini-api.html?m=1


取り込まれたソースをクリックし、実際にソースとして取り込まれた内容を確認します。

ソースガイドとして記事の概要が印刷されます。この他にも記事を取り込んでみましたが、驚くほど適切な概要になっています。ただし、記事にはGithub Gistのスニペットを埋め込んでいるのですが、それはソースとして取り込まれていません。


記事に貼り付けてあるスニペットもソースに取り込むために、モバイル向けのWebページをPDFに印刷し、PDFをソースとしてアップロードします。

PDFとしてアップロードすると、スニペットもソースに含まれます。

人間が読みやすいようにコードに行番号を表示していますが、AIに読ませることを考えると行番号は無い方がいい気がしています。


以下の6つの記事をソースとしてアップロードしました。


以下の質問をしました。

「Oracle APEXのアプリケーションからGoogle Geminiを呼び出す方法を教えてください。」

おおむね適切な回答になっています。

記事を探して読んで、該当する部分を自分で見つけるよりも、とにかくソースとしてPDFをアップロードして質問する方がはるかに効率が良い感じがします。


ソースコードを書いてください、という質問は、ソースにコードが含まれていても受け付けないか、記事の書き方か質問の仕方か、もしくはその双方の検討が必要そうです。

「Gogleのサービス・アカウントによる認証を行うPL/SQLコードを記述してください。」

それでも回答は、そのコードに近い部分を引用しています。


NotebookLMのSourcesのLimitationsとして「Each source can contain up to 500,000 words. We’ll review these limits periodically to help determine the best user experiences」とあり、1ソースあたり50万語(日本語ほぼ50万文字になるかもしれません)、数の上限は50(公式のドキュメントに該当する記載を見つけられなかったので、もしかしたらワード数のみが制限になった可能性はあります)とのことです。

ノートブックを作成し、記事をソースとしてアップロードするには相応の手間がかかります。相当に有用な印象を受けましたが、現時点ではGoogle NotebookLMは試験期間中で費用は発生しないので、費用対効果は分かりません。OpenAIのRetrievalで同じことができる、または、その他のフレームワークでも同じことはできる、というのはありますが、アプリケーションを作らず、単にファイルをアップロードするだけ、というのはアドバンテージがあります。

とにかく、本ブログの記事以外に、マニュアルやWebページをノートブックのソースとしてアップロードして、チャットで質問して問題を解決する、というのが現実的な手段になったと言えそうです。