Home
0h-n0 TechBLog
キャンセル

✍️ Anthropic解説: Effective Context Engineering for AI Agents

本記事は Effective Context Engineering for AI Agents(Anthropic Engineering Blog、2025年9月29日)の解説記事です。 ブログ概要(Summary) Anthropic Applied AIチームのPrithvi Rajasekaranらが公開した本ブログは、AIエージェントにおけるコンテキストエンジニアリングの体系...

✍️ Anthropic解説: Claude Code Best Practices for Agentic Coding

本記事は Claude Code: Best practices for agentic coding(Anthropic Engineering Blog)の解説記事です。 ブログ概要(Summary) AnthropicのエンジニアリングチームであるBoris Chernyらが公開した本ブログは、Claude Codeを使ったエージェント型コーディングのベストプラクティスを体系化した...

📄 論文解説: プロンプトキャッシュ戦略の体系的分析 — Claude/GPT-4/GeminiのAPIコスト60-80%削減

本記事は arXiv:2502.14051 (Analysis of Prompt Caching Strategies for LLM API Cost Reduction) の解説記事です。 論文概要(Abstract) 本論文はClaude、GPT-4、GeminiのAPIが提供するプロンプトキャッシュ機能を体系的に分析し、エージェント型RAGワークロードで60-80%のAPIコス...

📄 論文解説: RAG-Gym — MDP定式化とプロセス監督によるAgentic RAG最適化

本記事は RAG-Gym: Optimizing Reasoning and Search Agents with Process Supervision (arXiv:2502.13957) の解説記事です。 論文概要(Abstract) RAG-Gymは、推論エージェントが反復的に情報を検索して複雑な質問に回答するAgentic RAGを、マルコフ決定過程(MDP)として定式化し、プ...

📄 論文解説: CodeAct — 実行可能コードでLLMエージェントの行動空間を統一する

本記事は Executable Code Actions Elicit Better LLM Agents(Wang et al., 2024)の解説記事です。 論文概要(Abstract) CodeAct は、LLMエージェントの行動空間(Action Space)を「実行可能なPythonコード」に統一するフレームワークである。従来のJSONベースやテキストベースのアクション定義では...

📄 SIGCOMM 2024論文解説: CacheGen — KVキャッシュ圧縮・ストリーミングによるLLM高速化

本記事は CacheGen: KV Cache Compression and Streaming for Fast Large Language Model Serving(arxiv:2310.07240) の解説記事です。 論文概要(Abstract) CacheGenは、LLMサービングにおけるコンテキスト読み込み遅延を削減するシステムである。長大なコンテキスト(ドキュメント、F...

✍️ MLSys 2024 Best Paper解説: AWQ — 活性化ベース重み量子化でLLMを4bitに圧縮

本記事は arXiv:2306.00978 の解説記事です。 論文概要(Abstract) 著者らは、LLMの低ビット重み量子化手法AWQ(Activation-aware Weight Quantization)を提案している。中核的な観察として、全ての重みが等しく重要ではなく、活性化の大きさに基づいて重みの約1%が「重要(salient)」であることを発見した。これらの重要チャネルを...

📄 ICML 2025論文解説: Flexible and Efficient Grammar-Constrained Decoding

本記事は Flexible and Efficient Grammar-Constrained Decoding (arXiv:2502.05111) の解説記事です。 論文概要(Abstract) LLMの構造化出力を文脈自由文法(CFG)で保証する文法制約付きデコーディング(GCD: Grammar-Constrained Decoding)は、デコードの各ステップで「CFGに従わな...

✍️ Voyage AI解説: Voyage 4 — MoEアーキテクチャと共有Embedding空間による次世代テキスト埋め込み

本記事は Voyage AI Blog: The Voyage 4 model family: shared embedding space with MoE architecture の解説記事です。 ブログ概要(Summary) Voyage AIは2026年1月にVoyage 4シリーズを発表した。同シリーズは業界初の共有Embedding空間を実現し、異なるサイズのモデル間で互換...