ガードレール
ガードレールは、AIエージェントがユーザーメッセージにどのように応答すべきかを定義する構成可能な制約のセットです。これにより、攻撃的な言葉の使用防止、個人を特定できる情報 (PII) の漏洩回避、プロフェッショナルなトーンの維持、そして意図されたスコープ内での応答の制限など、特定のポリシーに沿った応答を保証します。
ガードレールは、Studio 内の Agent Settings から、またはコードを通じてプログラム的に有効化または無効化できます。
Studioでのガードレールの設定
Studio を通じてエージェントのガードレールを設定するには、以下の手順に従ってください:
- 左サイドバーの Agent Studio タブに移動します
- ガードレールを設定したいエージェントを選択します
- Agent Settings タブをクリックします
- Agent Guardrails セクションまでスクロールします
- 必要に応じて、4つの事前定義されたガードレールのいずれかを有効または無効にします
- (オプション) 追加の制約やガイドラインを指定するカスタムガードレールポリシーを定義します
Backend SDKでのガードレールの設定
エージェントのガードレールをプログラム的に更新するには、Backend SDK の updateGuardrails メソッドを使用します。以下は、ガードレールを有効にするための4つの事前設定オプションすべてを含む例です:
await this.squid.ai().agent('AGENT_ID').updateGuardrails({
disableProfanity: true,
professionalTone: true,
disablePii: true,
offTopicAnswers: true,
});
カスタムガードレールポリシーを追加するには、updateCustomGuardrails 関数を使用します:
await this.squid.ai().agent('AGENT_ID').updateCustomGuardrails('Sample custom guardrail');
カスタムガードレールポリシーを削除するには、deleteCustomGuardrail 関数を使用します:
await this.squid.ai().agent('AGENT_ID').deleteCustomGuardrail();
APIリクエストによるガードレールの設定
APIを使用してエージェントのガードレールを更新するには、以下のエンドポイントに POST リクエストを送信します:
POST /squid-api/v1/ai/agent/updateGuardrails
以下は、ガードレールを有効にするための4つの事前設定オプションすべてを含む例のペイロードリクエストです:
Content-Type: application/json
{
"agentId": "your-agent-id",
"guardrails": {
"disablePii": true,
"professionalTone": true,
"offTopicAnswers": true,
"disableProfanity": true
}
}
APIを使用してカスタムガードレールを更新するには、以下のエンドポイントに POST リクエストを送信します:
POST /squid-api/v1/ai/agent/updateCustomGuardrails
以下は、カスタムガードレールを追加するためのペイロードリクエストの例です:
Content-Type: application/json
{
"agentId": "your-agent-id",
"customGuardrail": "'Sample custom guardrail'"
}
APIを使用してカスタムガードレールを削除するには、以下のエンドポイントに POST リクエストを送信します:
POST /squid-api/v1/ai/agent/deleteCustomGuardrail
以下は、カスタムガードレールを削除するためのペイロードリクエストの例です:
Content-Type: application/json
{
"agentId": "your-agent-id",
}
結論
ガードレールは、AI生成レスポンスにおけるコンテンツの品質、コンプライアンス、そしてプロフェッショナリズムを維持するための強力な仕組みを提供します。UI またはコードを通じてこれらを設定することで、ユーザーは特定のニーズに合わせた応答を実現し、責任ある AI の動作を保証することができます。