📄 論文解説: Beyond Benchmarks — Evaluating Embedding Model Similarity for RAG Systems

本記事は arXiv:2407.08275 (Beyond Benchmarks: Evaluating Embedding Model Similarity for Retrieval Augmented Generation Systems) の解説記事です。論文概要（Abstract）本論文は、RAGシステムにおけるEmbeddingモデル選定の課題に取り組んでいる。著者ら（V...

21/03/2026 blog paper

embedding RAG evaluation +3

✍️ NVIDIA NeMo Guardrails解説：Colang言語によるプログラマブルLLMガードレール実装

本記事は NVIDIA Developer Blog: Building Safer LLM Apps with LangChain Templates and NVIDIA NeMo Guardrails の解説記事です。ブログ概要（Summary） NVIDIA NeMo Guardrailsは、LLMアプリケーションの入出力をプログラマブルに制御するためのオープンソースフレームワ...

21/03/2026 blog tech_blog

NVIDIA NeMo guardrails +4

📄 ICML 2024論文解説: LLMガードレールの体系的設計手法

論文概要本記事は ICML 2024 論文「Position: Building Guardrails for Large Language Models Requires Systematic Design」の解説記事です。著者らは、LLM の入出力をフィルタリングするガードレール技術について、現行のオープンソースソリューション（Llama Guard、NVIDIA NeMo Guar...

21/03/2026 blog paper

LLM guardrails ICML +3

📄 論文解説: FrugalGPT — LLMコスト98%削減のカスケード戦略

論文概要本記事は arXiv 論文 2305.13246 の解説記事です。Stanford大学の Lingjiao Chen、Matei Zaharia、James Zou らによる「FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance」（2023年5月公開）は、...

21/03/2026 blog paper

LLM cost-optimization cascade +3

📄 論文解説: Llama Guard — LLMベース入出力ガードレールの設計と実装

論文概要（Abstract）本記事はarXiv論文 2312.06674 の解説記事です。 Llama Guardは、Meta AIが2023年12月に発表したLLMベースの入出力安全性分類モデルである。人間とAIの会話において、ユーザープロンプト（入力）とモデルレスポンス（出力）の双方を、MLCommons AI Safetyタクソノミーに基づく6カテゴリで「safe」または「uns...

21/03/2026 blog paper

LLM guardrails safety +3

✍️ AWSマルチテナント生成AIゲートウェイ：企業向けコスト追跡・テナント分離アーキテクチャ解説

ブログ概要本記事は、AWS公式ブログ「Build a multi-tenant generative AI environment for your enterprise on AWS」の解説記事です。 AWSはこのブログにおいて、企業内の複数事業部門やチームが Amazon Bedrock の基盤モデル（Foundation Model）に安全かつ効率的にアクセスするための内部Saa...

21/03/2026 blog tech_blog

AWS Bedrock multi-tenant +4

📄 論文解説: Reflexion — 言語エージェントのための言語的強化学習フレームワーク

論文概要（Abstract）本記事は arXiv:2303.11366（Shinn et al., 2023）の解説記事です。 Reflexionは、LLMエージェントがモデルの重み更新なしに、言語的な自己反省（verbal reflection）を通じて試行錯誤から学習するフレームワークである。従来の強化学習がスカラー報酬と勾配更新に依存するのに対し、Reflexionはエージェント...

21/03/2026 blog paper

Reflexion ReAct LLM-agent +4

📄 論文解説: AgentPRM — プロセス報酬モデルによるLLMエージェントの段階的改善フレームワーク

論文概要 Process Reward Models for LLM Agents: Practical Framework and Directions（Sanjiban Choudhury, Cornell University, 2025年2月）は、LLMエージェントにProcess Reward Model（PRM）を統合する実用的なフレームワーク「AgentPRM」を提案する。従...

21/03/2026 blog paper

LLM-agent process-reward-model reinforcement-learning +2

📄 論文解説: RAGAS — Automated Evaluation of Retrieval Augmented Generation

本記事は arXiv:2309.15217 (RAGAS: Automated Evaluation of Retrieval Augmented Generation) の解説記事です。論文概要（Abstract） RAGAS（Retrieval-Augmented Generation Assessment Suite）は、RAGシステムを参照回答なしに自動評価するフレームワークを...

21/03/2026 blog paper

RAG evaluation embedding +3

✍️ 調査レポート解説: LangChain State of AI Agents 2025 — 1,340名調査に見るエージェント本番運用の実態

レポート概要 State of AI Agents（LangChain, 2025年12月公開）は、1,340名のエンジニア・プロダクトマネージャー・経営層を対象にした、AIエージェントの本番運用実態に関する大規模調査レポートである。調査期間は2025年11月18日〜12月2日。テクノロジー業界（63%）を中心に、金融（10%）、ヘルスケア（6%）、教育（4%）など多岐にわたる産業から回答...

21/03/2026 blog techblog

LLM-agent production observability +2

1
...
64
65
66
...
134
65 / 134