📄 論文解説: BGE M3-Embedding - 1つのモデルでDense・Sparse・ColBERTハイブリッド検索を実現

本記事は arXiv:2402.03216 の解説記事です。論文概要（Abstract） BGE M3-Embedding（以下M3）は、BAAI（Beijing Academy of Artificial Intelligence）が提案した埋め込みモデルであり、Multi-Linguality（100言語以上対応）、Multi-Functionality（Dense/Sparse/...

06/03/2026 blog paper

embedding hybrid-search sparse-retrieval +4

📄 論文解説: Mem0 - 本番対応AIエージェントのためのスケーラブル長期記憶

本記事は arXiv:2504.19413 Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory の解説記事です。論文概要（Abstract） Chhikara, Khant, Aryan, Singh, Yadav（2025）は、LLMがコンテキストウィンドウの制約によりマルチセッション会話で...

06/03/2026 blog paper

LLM-memory agent-memory Mem0 +6

✍️ Kubernetes v1.34 DRA GA解説: GPUの動的リソース割り当てが安定版に

ブログ概要（Summary）本記事は Kubernetes v1.34: DRA has graduated to GA の解説記事です。 Kubernetes v1.34（2025年8月27日リリース、コードネーム “Of Wind & Will”）において、Dynamic Resource Allocation（DRA）がGeneral Availability（GA）に到...

06/03/2026 blog tech_blog

kubernetes DRA GPU +2

✍️ AWS公式ブログ解説: Bedrock AgentCoreエピソード記憶でエージェントに経験学習能力を付与する

本記事は Build agents to learn from experiences using Amazon Bedrock AgentCore episodic memory および Episodic memory strategy - Amazon Bedrock AgentCore の解説記事です。ブログ概要（Summary） AWSは2025年12月のre:Inventで、...

06/03/2026 blog tech_blog

AWS Bedrock AgentCore +6

📄 論文解説: DAT - Dynamic Alpha Tuning for Hybrid Retrieval in RAG

本記事は arXiv:2503.23013 の解説記事です。論文概要（Abstract） DAT（Dynamic Alpha Tuning）は、RAG（Retrieval-Augmented Generation）におけるハイブリッド検索の重み付けを、クエリごとに動的に調整する手法である。従来のハイブリッド検索では、BM25とDense Retrievalのスコアを固定のalpha値で...

06/03/2026 blog paper

hybrid-search BM25 dense-retrieval +3

📄 論文解説: Evaluating AGENTS.md — リポジトリレベルコンテキストファイルはコーディングエージェントに有効か

本記事は arXiv:2602.11988 の解説記事です。論文概要（Abstract） AIコーディングエージェントの普及に伴い、リポジトリのルートに配置する AGENTS.md（Devin）や CLAUDE.md（Claude Code）、.cursorrules（Cursor）といったコンテキストファイルが広く使われるようになっている。しかし、これらのファイルが実際にエージェント...

06/03/2026 blog paper

AGENTS.md coding-agents SWE-bench +5

📄 論文解説: AutoTool — グラフベースのツール遷移確率によるLLMエージェントの効率的ツール選択

本記事は AutoTool: Efficient Tool Selection for Large Language Model Agents の解説記事です。論文概要（Abstract） LLMエージェントにおけるツール選択は、各ステップでLLMに推論を要求するためコストが高い。本論文は、エージェントの過去の実行履歴（trajectory）からツール間の遷移パターンを有向グラフとして...

05/03/2026 blog paper

tool-selection graph LLM +7

✍️ LLMトークン最適化: セマンティックキャッシュとプロンプト圧縮によるコスト・レイテンシ削減

ブログ概要（Summary）本記事は Redis: LLM Token Optimization: Cut Costs & Latency in 2026 の解説記事です。 LLMのトークンはAPI利用の「通貨」であり、各トークンがコストとレイテンシに直結します。ブログでは、トークン消費の最適化手法を基盤テクニック（追加ツール不要）と高度な最適化（セマンティックキャッシュ等）に...

05/03/2026 blog tech_blog

LLM token optimization semantic caching +2

📄 論文解説: Toolshed — RAG-Tool Fusionによる大規模ツール選択のスケーリング手法

本記事は Toolshed: Scale Tool-Equipped Agents with Advanced RAG-Tool Fusion and Tool Knowledge Bases の解説記事です。論文概要（Abstract） LLMエージェントが利用可能なツールの数が増加するにつれ、全ツールのスキーマをコンテキストに収めることが困難になる。本論文は、RAG（Retriev...

05/03/2026 blog paper

tool-selection RAG LLM +6

✍️ LLMアプリケーションにおけるリトライ・フォールバック・サーキットブレーカーの使い分け

ブログ概要（Summary）本記事は Portkey: Retries, fallbacks, and circuit breakers in LLM apps: what to use when の解説記事です。 LLMアプリケーションの本番運用において、プロバイダーの障害やレート制限は避けられません。ブログでは、この問題に対する3つの相補的なパターン — リトライ（一時的エラーから...

05/03/2026 blog tech_blog

circuit breaker LLM reliability +2

1
...
37
38
39
...
86
38 / 86