最近の更新
safety 10
- 論文解説: GuardAgent — 知識ベース推論によるLLMエージェントの安全性保証 10/06/2026
- 論文解説: InferAct — LLMエージェントの安全なアクション推論と事前評価 07/05/2026
- EMNLP 2024論文解説: LLMのツール利用アラインメント — H2A原則による安全なエージェント設計 04/05/2026
- 論文解説: SafeMLRM — マルチモーダル推論モデルの安全性を初めて体系的に評価したフレームワーク 26/04/2026
- 論文解説: Towards a Science of AI Agent Reliability 05/04/2026
- ICML 2024論文解説: LLMガードレールの体系的設計手法 21/03/2026
- 論文解説: Llama Guard — LLMベース入出力ガードレールの設計と実装 21/03/2026
- 論文解説: MAESTRO — Multi-Agent Evaluation and Testing for Real-world Orchestration 22/02/2026
- 論文解説: Llama Guard — LLMベースの入出力セーフガードモデル 17/02/2026
- 論文解説: NeMo Guardrails - プログラマブルなLLM安全性制御フレームワーク 17/02/2026