「できることを全部やらせる」発想だと、想定外の操作まで通ってしまいます。逆転の発想で、まず「これだけは絶対にやらせない」を先に書き出すと境界がはっきりします。顧客データの一括削除、外部への送信、本番設定の変更、決済の確定。取り返しのつかない操作ほど、禁止リストの上位に置くべきです。
リストは頭の中に置くのではなく、エージェントが実際にその操作を拒む仕組みにつなげて初めて効きます。許可を広げるより、危険な操作を名指しで塞ぐほうが現場でも納得されます。自社の業務で「これをAIにやられたら困る」操作を五つ挙げるところから始めてみてください。