Guardrails (ガードレール)
ガードレールは、AIエージェントがユーザーメッセージにどのように応答するかを定義する、設定可能な制約のセットです。これにより、応答が攻撃的な言葉の使用防止、個人を特定できる情報 (PII) の開示防止、プロフェッショナルなトーンの維持、および意図された範囲内での回答に限定されるなど、特定のポリシーに従うことが保証されます。
ガードレールは、Studio の Agent Settings から、またはコードを通じてプログラム的に有効化または無効化できます。
Configuring Guardrails in the Studio
Studio でエージェントのガードレールを設定するには、以下の手順に従ってください:
- 左サイドバーの Agent Studio タブに移動します
- ガードレールを設定するエージェントを選択します
- Agent Settings タブをクリックします
- Agent Guardrails セクションまでスクロールします
- 必要に応じて、4 つの事前定義されたガードレールのうち任意のものを有効または無効にします
- (オプション)追加の制約またはガイドラインを指定するために、カスタムガードレールポリシーを定義します
Configuring Guardrails in the Backend SDK
エージェントのガードレールをプログラムで更新するには、Backend SDK の updateGuardrails
メソッドを使用します。以下は、ガードレールを有効にするための 4 つの事前設定オプションをすべて含む例です:
await this.squid.ai().agent('AGENT_ID').updateGuardrails({
disableProfanity: true,
professionalTone: true,
disablePii: true,
offTopicAnswers: true,
});
カスタムガードレールポリシーを追加するには、updateCustomGuardrails
関数を使用します:
await this.squid.ai().agent('AGENT_ID').updateCustomGuardrails('Sample custom guardrail');
カスタムガードレールポリシーを削除するには、deleteCustomGuardrail
関数を使用します:
await this.squid.ai().agent('AGENT_ID').deleteCustomGuardrail();
Configuring Guardrails via an API Request
API を使用してエージェントのガードレールを更新するには、次のエンドポイントに POST リクエストを送信します:
POST /squid-api/v1/ai/agent/updateGuardrails
以下は、ガードレールを有効にするための 4 つの事前設定オプションをすべて含む例のペイロードリクエストです:
Content-Type: application/json
{
"agentId": "your-agent-id",
"guardrails": {
"disablePii": true,
"professionalTone": true,
"offTopicAnswers": true,
"disableProfanity": true
}
}
API を使用してカスタムガードレールを更新するには、次のエンドポイントに POST リクエストを送信します:
POST /squid-api/v1/ai/agent/updateCustomGuardrails
以下は、カスタムガードレールを追加するための例のペイロードリクエストです:
Content-Type: application/json
{
"agentId": "your-agent-id",
"customGuardrail": "'Sample custom guardrail'"
}
API を使用してカスタムガードレールを削除するには、次のエンドポイントに POST リクエストを送信します:
POST /squid-api/v1/ai/agent/deleteCustomGuardrail
以下は、カスタムガードレールを削除するための例のペイロードリクエストです:
Content-Type: application/json
{
"agentId": "your-agent-id",
}
Conclusion
ガードレールは、AI 生成の応答におけるコンテンツ品質、コンプライアンス、プロフェッショナリズムを維持するための堅牢な仕組みを提供します。UI またはコードを介してこれらを設定することで、ユーザーは責任ある AI の動作を保証しつつ、特定のニーズに合わせて応答を調整することができます。