Home
0h-n0 TechBLog
キャンセル

✍️ Anthropic Advanced Tool Use解説: Claude のツール検索・プログラマティック呼び出し・使用例の3機能

ブログ概要(Summary) 本記事は Anthropic Engineering Blog: Introducing advanced tool use の解説記事です。 Anthropicは2025年11月24日、Claude向けの高度なツール呼び出し機能として3つのベータ機能を発表した。(1) Tool Search Toolはツール定義のオンデマンド読み込みによりコンテキストウィ...

📄 論文解説: Don't Break the Cache — プロンプトキャッシュでエージェントタスクのコストを41-80%削減

論文概要(Abstract) 本記事は Don’t Break the Cache (arXiv: 2601.06007) の解説記事です。 LLMプロバイダーが提供するプロンプトキャッシュ機能は、APIコストとレイテンシの削減に有効であるが、マルチターンのエージェントワークフローにおける効果は十分に検証されていなかった。著者らは、OpenAI・Anthropic・Googleの3大プロ...

📄 論文解説: Less is More — エッジデバイスでのFunction Calling最適化

本記事は Less is More: Optimizing Function Calling for LLM Execution on Edge Devices (arXiv: 2411.15399) の解説記事です。 論文概要(Abstract) エッジデバイス上でのLLMエージェント展開において、Function Calling(関数呼び出し)の性能がボトルネックとなっている。著者ら...

📄 論文解説: MemGPT — LLMをオペレーティングシステムとして扱う仮想コンテキスト管理

本記事は MemGPT: Towards LLMs as Operating Systems (arXiv: 2310.08560) の解説記事です。 論文概要(Abstract) MemGPTは、従来のオペレーティングシステム(OS)における仮想メモリとページングの概念をLLMのコンテキスト管理に応用した研究である。LLMの固定長コンテキストウィンドウを「メインメモリ(RAM)」、外部...

📄 EMNLP 2025論文解説: Tool Preferences in Agentic LLMs are Unreliable — ツール選択の脆弱性

本記事は Tool Preferences in Agentic LLMs are Unreliable (arXiv: 2505.18135) の解説記事です。 論文概要(Abstract) LLMがツール(関数)を選択する際、テキストで記述されたdescriptionのみに依存するプロセスが驚くほど脆弱であることを実証した研究である。著者らは、ツールの機能を一切変更せずdescrip...

📄 ICML 2025論文解説: Berkeley Function Calling Leaderboard (BFCL) — LLMツール呼び出し評価の標準ベンチマーク

本記事は BFCL論文 の解説記事です。 論文概要(Abstract) Berkeley Function Calling Leaderboard(BFCL)は、LLMのFunction Calling能力を包括的に評価するためのベンチマークである。著者らは、2000以上の質問-関数-回答ペアを用意し、Python・Java・JavaScript・REST APIの4言語にわたる評価を行...

✍️ サーベイ解説: 投機的デコーディングの包括的調査 - LLM推論高速化手法の分類と比較

論文概要(Abstract) 本記事は Unlocking Efficiency in Large Language Model Inference: A Comprehensive Survey of Speculative Decoding の解説記事です。 大規模言語モデル(LLM)の自己回帰デコーディングに起因する高い推論レイテンシを軽減するため、投機的デコーディング(Specu...

📄 論文解説: EAGLE-2 - 動的ドラフトツリーによるLLM推論の高速化

本記事は EAGLE-2: Faster Inference of Language Models with Dynamic Draft Trees の解説記事です。 論文概要(Abstract) LLMの推論は自己回帰デコーディングの逐次的性質により計算コストが高く、投機的サンプリング(speculative sampling)がその有効な解決策として注目されている。著者らは、EAGL...