Home
0h-n0 TechBLog
キャンセル

✍️ Kubernetes v1.34 DRA GA解説: GPUの動的リソース割り当てが安定版に

ブログ概要(Summary) 本記事は Kubernetes v1.34: DRA has graduated to GA の解説記事です。 Kubernetes v1.34(2025年8月27日リリース、コードネーム “Of Wind & Will”)において、Dynamic Resource Allocation(DRA)がGeneral Availability(GA)に到...

📄 論文解説: DAT - Dynamic Alpha Tuning for Hybrid Retrieval in RAG

本記事は arXiv:2503.23013 の解説記事です。 論文概要(Abstract) DAT(Dynamic Alpha Tuning)は、RAG(Retrieval-Augmented Generation)におけるハイブリッド検索の重み付けを、クエリごとに動的に調整する手法である。従来のハイブリッド検索では、BM25とDense Retrievalのスコアを固定のalpha値で...

📄 論文解説: Evaluating AGENTS.md — リポジトリレベルコンテキストファイルはコーディングエージェントに有効か

本記事は arXiv:2602.11988 の解説記事です。 論文概要(Abstract) AIコーディングエージェントの普及に伴い、リポジトリのルートに配置する AGENTS.md(Devin)や CLAUDE.md(Claude Code)、.cursorrules(Cursor)といったコンテキストファイルが広く使われるようになっている。しかし、これらのファイルが実際にエージェント...

📄 論文解説: AutoTool — グラフベースのツール遷移確率によるLLMエージェントの効率的ツール選択

本記事は AutoTool: Efficient Tool Selection for Large Language Model Agents の解説記事です。 論文概要(Abstract) LLMエージェントにおけるツール選択は、各ステップでLLMに推論を要求するためコストが高い。本論文は、エージェントの過去の実行履歴(trajectory)からツール間の遷移パターンを有向グラフとして...

✍️ LLMトークン最適化: セマンティックキャッシュとプロンプト圧縮によるコスト・レイテンシ削減

ブログ概要(Summary) 本記事は Redis: LLM Token Optimization: Cut Costs & Latency in 2026 の解説記事です。 LLMのトークンはAPI利用の「通貨」であり、各トークンがコストとレイテンシに直結します。ブログでは、トークン消費の最適化手法を基盤テクニック(追加ツール不要)と高度な最適化(セマンティックキャッシュ等)に...

📄 論文解説: Toolshed — RAG-Tool Fusionによる大規模ツール選択のスケーリング手法

本記事は Toolshed: Scale Tool-Equipped Agents with Advanced RAG-Tool Fusion and Tool Knowledge Bases の解説記事です。 論文概要(Abstract) LLMエージェントが利用可能なツールの数が増加するにつれ、全ツールのスキーマをコンテキストに収めることが困難になる。本論文は、RAG(Retriev...

✍️ LLMアプリケーションにおけるリトライ・フォールバック・サーキットブレーカーの使い分け

ブログ概要(Summary) 本記事は Portkey: Retries, fallbacks, and circuit breakers in LLM apps: what to use when の解説記事です。 LLMアプリケーションの本番運用において、プロバイダーの障害やレート制限は避けられません。ブログでは、この問題に対する3つの相補的なパターン — リトライ(一時的エラーから...