2023年12月24日日曜日

Google Geminiのマルチターンと関数呼び出しを実装する

Google Gemniを呼び出すアプリケーションにマルチターン(いわゆるチャット)と関数呼び出しを行うページを追加します。どちらの呼び出し方も、OpenAIのChat Completions APIに非常に近いため、以下の記事の実装を援用します。

OpenAIのChatGPTのAPIを呼び出すAPEXアプリを作る

作成したアプリケーションは以下のように動作します。

関数呼び出しが行われた場合(Chat HistoryのタイプでfunctionResponseが現れた場合)関数呼び出しの戻り値をGeminiに渡すため、Textを空白にしてRunをクリックする必要があります。


最初に関数呼び出しの、呼び出し対象となるファンクションを登録する表を作成します。

クイックSQLの以下のモデルより、表GEMINI_FUNCTIONSを作成します。

# prefix: gemini
functions
function_name vc200 /nn
function_set_name vc20 /nn
description vc4000 /nn
parameters json /nn
この表はOpenAIでの作業の際に作成した表OPENAI_FUNCTIONSとOPENAI_FUNCTION_SETを(不具合の修正も合わせて)簡素にしています。この表にサンプルとして設定するファンクションとして、OpenAIのときと同じget_current_weatherを使用します。


表を作成した後、この表にデータを投入するためにフォーム付き対話モード・レポートのページを作成します。

ページの作成をクリックします。


対話モード・レポートを選択します。


対話モード・レポートのページのページ名はFunctionsとします。フォーム・ページを含めるチェックします。フォーム・ページ名Function Detailとします。

データ・ソース表/ビューの名前GEMINI_FUNCTIONSを指定します。

へ進み、主キー列1ID (Number)を選択しページの作成をクリックすると、表GEMINI_FUNCTIONS対話モード・レポートフォームのページが作成されます。


ファンクションGET_CURRENT_WEATHERも作成しておきます。元記事に説明がありますが、このファンクションは引数である都市名から座標を得るために、アマノ技研さんより提供されている「世界の百万都市の位置データ Location Data of Megacities」のCSVファイルを表AMANO_CITY_LOCATIONSにロードしています。

create or replace function get_current_weather(
p_args in clob
)
return clob
as
l_args json_object_t;
l_location varchar2(400);
l_location_tokens apex_t_varchar2;
l_lat number;
l_lon number;
l_url varchar2(4000);
l_response clob;
l_response_json json_object_t;
l_weathercode number;
l_weather varchar2(4000);
begin
l_args := json_object_t(p_args);
l_location := l_args.get_string('location');
/* get first part (city name) from the location */
l_location_tokens := apex_string.split(l_location, '[ ,]');
l_location := l_location_tokens(1);
/*
* 都市名から緯度経度の情報を取り出す。
* アマノ技研さんより提供されている「世界の百万都市の位置データ Location Data of Megacities」の
* CSVファイルを表AMANO_CITY_LOCATIONSにロードしています。
* 参照: https://amano-tec.com/data/megacities.html
*/
select lat, lon into l_lat, l_lon
from amano_city_locations
where upper(capital_en) = upper(l_location) or capital_jp = l_location;
/*
* Open-Meteo.comのAPIを呼び出し、指定した座標の現在の天気を取得しています。
* 参照: https://open-meteo.com
*/
l_url := 'https://api.open-meteo.com/v1/forecast?latitude=' || l_lat || '&longitude=' || l_lon || '&current=weathercode';
l_response := apex_web_service.make_rest_request(
p_url => l_url
,p_http_method => 'GET'
);
if apex_web_service.g_status_code <> 200 then
return '{ "error": "open-meteo.com api call failed, response = ' || l_response || '" }';
end if;
l_response_json := json_object_t(l_response);
/*
* Weather Code (WMO 4501)のコードの説明は以下の気象関係コード表のWMO 4501の部分を
* 表WMO4501として読み込んでいます。
* 参照: https://www.jodc.go.jp/data_format/weather-code_j.html
*/
l_weathercode := l_response_json.get_object('current').get_number('weathercode');
select description into l_weather from wmo4501 where code = l_weathercode;
return '{ "weather" : "' || l_weather || '" }';
exception
when no_data_found then
return '{ "error": "no data found" }';
end get_current_weather;
/
アプリケーションを実行しFunctionsのページを開き、作成をクリックします。


ファンクションGET_CURRENT_WEATHERを登録します。

Function nameとしてget_current_weatherFunction Set NameとしてWeatherDescriptionとしてGet the current weather in a given locationParametersには以下のJSONドキュメントを記述します。
{
  "type": "object",
  "properties": {
    "location": {
      "type": "string",
      "description": "The city name"
    },
    "unit": {
      "type": "string",
      "enum": [
        "celsius",
        "fahrenheit"
      ]
    }
  },
  "required": [
    "location"
  ]
}
これらはOpenAIでFunction Callingを行う際に設定した内容とほぼ同じです。双方とも関数呼び出しの引数の定義は、OpenAPI 3.0に準拠しています。

作成をクリックします。


ファンクションget_current_weatherが設定されます。


APEXアプリケーションへマルチターンの処理を行うページを追加します。

ページの作成をクリックします。


空白のページを選択します。


ページ番号は、ページの名前Chatとします。

ページの作成をクリックします。


空白のページが作成されます。

会話を初期化するボタンINIT_CONVERSATIONを作成します。ラベルはInitialize Conversation動作アクションはデフォルトのページの送信です。テンプレート・オプションWidthStretchに変更しています。


プロセス・ビューを開き、このボタンINIT_CONVERSATIONがクリックされたときに実行されるプロセスを作成します。

作成したプロセスの識別名前Initialize Conversationとします。タイプコードを実行です。ソースPL/SQLコードに以下を記述します。チャット履歴を保持するAPEXコレクションGEMINIを初期化しています。
apex_collection.create_or_truncate_collection(
    p_collection_name => 'GEMINI'
);
サーバー側の条件ボタン押下時INIT_CONVERSATIONを指定します。


レンダリング・ビューに戻ります。

テキストを入力するページ・アイテムP6_TEXTを作成します。タイプテキスト領域ラベルTextとします。

セッション・ステートデータ型CLOBを選択し、続けて同じテキストを送信してしまわないように、ストレージとしてリクエストごと(メモリーのみ)を選択します。


ファンクション・セットを選択するページ・アイテムP6_FUNCTION_SETを作成します。

タイプ選択リストラベルFunction Setとします。LOVタイプSQL問合せを選択し、SQL問合せとして以下を記述します。
select function_set_name d, function_set_name r from gemini_functions group by function_set_name order by 1 asc
追加値の表示オフNULL値の表示オンとし、NULL表示値として- ファンクション・セットを選択 -と記述します。

セッション・ステートストレージセッションごと(永続)を選択します。


会話を実行するボタンRUNを作成します。ラベルはRun動作アクションはデフォルトのページの送信です。外観ホットオンにします。テンプレート・オプションWidthStretchに変更しています。


プロセス・ビューを開き、このボタンRUNがクリックされたときに実行されるプロセスを作成します。

作成したプロセスの識別名前Run Conversationとします。タイプコードを実行です。ソースPL/SQLコードに以下を記述します。

declare
l_user_text clob := :P6_TEXT;
l_functioin_set_name varchar2(40) := :P6_FUNCTION_SET;
--
l_contents json_array_t := json_array_t();
l_contents_clob clob;
l_content json_object_t;
l_parts json_array_t;
l_part json_object_t;
-- function calling
l_functions json_array_t;
l_function json_object_t;
l_parameters json_object_t;
l_tools json_array_t;
l_tools_clob clob;
l_tool json_object_t;
-- response
l_candidates json_array_t;
l_prompt_feedback json_object_t;
l_response clob;
l_reply clob;
l_role varchar2(8);
begin
/*
  * add user input first.
*/
if l_user_text is not null then
apex_collection.add_member(
p_collection_name => 'GEMINI'
,p_c001 => 'user'
,p_c002 => 'text'
,p_clob001 => l_user_text
);
end if;
/*
  * reconstruct chat history from apex collection.
*/
for r in (select c001, c002, clob001 from apex_collections where collection_name = 'GEMINI' order by seq_id)
loop
l_content := json_object_t();
l_content.put('role',r.c001);
l_part := json_object_t();
case r.c002
when 'text' then
l_part.put('text', r.clob001);
else
l_part.put(r.c002, json_object_t(r.clob001));
end case;
l_parts := json_array_t();
l_parts.append(l_part);
l_content.put('parts', l_parts);
l_contents.append(l_content);
end loop;
l_contents_clob := l_contents.to_clob();
-- prepare tools
if l_functioin_set_name is not null then
l_functions := json_array_t();
for r in (
select * from gemini_functions where function_set_name = l_functioin_set_name
)
loop
l_function := json_object_t();
l_function.put('name', r.function_name);
l_function.put('description', r.description);
l_parameters := json_object_t(r.parameters);
l_function.put('parameters', l_parameters);
l_functions.append(l_function);
end loop;
l_tool := json_object_t();
l_tool.put('function_declarations', l_functions);
l_tools := json_array_t();
l_tools.append(l_tool);
l_tools_clob := l_tools.to_clob();
else
l_tools_clob := null;
end if;
-- apex_debug.info(l_contents_clob);
utl_google_gemini_api.generate_content(
p_contents => l_contents_clob
,p_tools => l_tools_clob
,p_candidates => l_candidates
,p_prompt_feedback => l_prompt_feedback
,p_response => l_response
,p_credential_static_id => :G_CREDENTIAL
);
apex_debug.info(l_response);
l_part := utl_google_gemini_api.get_first_part(
p_candidates => l_candidates
,p_role => l_role
);
l_reply := l_part.get_string('text');
if l_reply is null then
/* append functionCall to chat history. */
apex_collection.add_member(
p_collection_name => 'GEMINI'
,p_c001 => l_role
,p_c002 => 'functionCall'
,p_clob001 => l_part.get_object('functionCall').to_clob()
);
/* call external function */
l_reply := utl_google_gemini_api.call_function(
p_part => l_part
);
/* append functionResponse to chat history */
apex_collection.add_member(
p_collection_name => 'GEMINI'
,p_c001 => 'function'
,p_c002 => 'functionResponse'
,p_clob001 => l_reply
);
else
apex_collection.add_member(
p_collection_name => 'GEMINI'
,p_c001 => l_role
,p_c002 => 'text'
,p_clob001 => l_reply
);
end if;
end;
サーバー側の条件ボタン押下時RUNを指定します。


レンダリング・ツリーに戻り、チャット履歴を表示するクラシック・レポートのリージョンを作成します。

識別タイトルChat HistoryソースタイプとしてSQL問合せを選択し、SQL問合せとして以下を記述します。
select c001, c002, clob001 from apex_collections where collection_name = 'GEMINI' order by seq_id

C001ヘッダーroleとします。


C002のヘッダーをtypeとします。


CLOB001タイプリッチ・テキストに変更します。ヘッダーtextです。設定書式としてマークダウンを選択します。


以上でアプリケーションは完成です。アプリケーションを実行すると、記事の先頭のGIF動画のように動作します。

今回作成したアプリケーションのエクスポートを以下に置きました。
https://github.com/ujnak/apexapps/blob/master/exports/google-gemini2.zip

Oracle APEXのアプリケーション作成の参考になれば幸いです。