ガードレール
ガードレールは、AIエージェントがユーザーメッセージにどのように応答すべきかを定義する、設定可能な制約のセットです。これにより、不適切な言葉の防止、個人を特定できる情報(PII)の開示回避、プロフェッショナルなトーンの維持、意図した範囲内への回答の制限など、特定のポリシーに応答が準拠することを保証します。
ガードレールは、Studio の Agent Settings から、またはコードを通じてプログラム的に有効化/無効化できます。
Studio でガードレールを設定する
Studio を使用してエージェントのガードレールを設定するには、次の手順に従います。
- 左側サイドバーの Agent Studio タブに移動します
- ガードレールを設定したいエージェントを選択します
- Agent Settings タブをクリックします
- Agent Guardrails セクションまでスクロールします
- 必要に応じて、4つの事前定義されたガードレールのいずれかを有効化または無効化します
- (任意)追加の制約やガイドラインを指定するために、カスタムガードレールポリシーを定義します
Backend SDK でガードレールを設定する
エージェントのガードレールをプログラム的に更新するには、Backend SDK の updateGuardrails メソッドを使用します。以下は、ガードレールを有効にするための4つのプリセットオプションをすべて含む例です。
await this.squid.ai().agent('AGENT_ID').updateGuardrails({
disableProfanity: true,
professionalTone: true,
disablePii: true,
offTopicAnswers: true,
});
カスタムガードレールポリシーを追加するには、updateCustomGuardrails 関数を使用します。
await this.squid.ai().agent('AGENT_ID').updateCustomGuardrails('Sample custom guardrail');
カスタムガードレールポリシーを削除するには、deleteCustomGuardrail 関数を使用します。
await this.squid.ai().agent('AGENT_ID').deleteCustomGuardrail();
API リクエストでガードレールを設定する
API を使用してエージェントのガードレールを更新するには、次のエンドポイントに POST リクエストを送信します。
POST /squid-api/v1/ai/agent/updateGuardrails
以下は、ガードレールを有効にするための4つのプリセットオプションをすべて含むリクエストペイロードの例です。
Content-Type: application/json
{
"agentId": "your-agent-id",
"guardrails": {
"disablePii": true,
"professionalTone": true,
"offTopicAnswers": true,
"disableProfanity": true
}
}
API を使用してカスタムガードレールを更新するには、次のエンドポイントに POST リクエストを送信します。
POST /squid-api/v1/ai/agent/updateCustomGuardrails
以下は、カスタムガードレールを追加するためのリクエストペイロード例です。
Content-Type: application/json
{
"agentId": "your-agent-id",
"customGuardrail": "'Sample custom guardrail'"
}
API を使用してカスタムガードレールを削除するには、次のエンドポイントに POST リクエストを送信します。
POST /squid-api/v1/ai/agent/deleteCustomGuardrail
以下は、カスタムガードレールを削除するためのリクエストペイロード例です。
Content-Type: application/json
{
"agentId": "your-agent-id",
}
まとめ
ガードレールは、AI が生成する応答におけるコンテンツ品質、コンプライアンス、そしてプロフェッショナリズムを維持するための堅牢な仕組みを提供します。UI またはコードで設定することで、責任ある AI の振る舞いを確保しつつ、ユーザーは要件に合わせて応答を調整できます。