Home
0h-n0 TechBLog
キャンセル

📄 論文解説: Matryoshka Representation Learning — 可変次元埋め込みによる適応的表現学習

論文概要(Abstract) Matryoshka Representation Learning(MRL)は、University of Washingtonの Kusupatiらが2022年に提案した表現学習手法である。通常の埋め込みモデルは固定次元のベクトルを出力するが、MRLでは単一のモデルで複数の粒度(8, 16, 32, …, 2048次元)の埋め込みを同時に学習する。学習済み...

📄 CIDR 2025論文解説: Text2SQL is Not Enough — TAGフレームワークによるDB×LLM推論の統合

本記事は arXiv:2408.14717(CIDR 2025採択)の解説記事です。 論文概要(Abstract) Biswalらは、自然言語によるデータベース質問応答において、Text2SQLとRAGはそれぞれ相補的な強みを持つが、単独では実世界の複雑な質問の20〜80%に回答できないことを示した。著者らはTable-Augmented Generation(TAG)を提案し、データベ...

📄 NeurIPS 2025論文解説: A-MEM — Zettelkasten方式によるLLMエージェントの自律的メモリ管理

本記事は arXiv:2502.12110 の解説記事です。 論文概要(Abstract) A-MEMは、LLMエージェントのメモリ管理にZettelkasten方式を適用した新しいアプローチである。従来のベクトルデータベースやKey-Valueストアによるメモリは、情報を孤立したチャンクとして扱うため、記憶間の文脈的な関連性を捉えることができなかった。著者らはこの問題に対し、各メモリを...

✍️ Anthropic解説: Building Effective Agents — 5つの構成パターンとエージェント設計の実践原則

本記事は Building Effective Agents (Anthropic Research) の解説記事です。 ブログ概要(Summary) Anthropicが公開した本ガイドは、多数のチームとの協業経験に基づき、LLMエージェント設計の実践的な原則とパターンを体系化したものである。著者らは、エージェントシステムの構成要素を「拡張されたLLM(Augmented LLM)」と...

📄 論文解説: HELMET — 51モデルで検証する長コンテキストLLMの効果的な評価フレームワーク

本記事は https://arxiv.org/abs/2410.02694 の解説記事です。 論文概要(Abstract) HELMET(How to Evaluate Long-Context Language Models Effectively and Thoroughly)は、長コンテキスト言語モデル(LCLM)を包括的に評価するためのベンチマークフレームワークである。著者らは、...

✍️ Anthropic Engineering Blog解説: How We Built Our Multi-Agent Research System

ブログ概要(Summary) Hadfield, Zhang, Lien, Scholz, Fox, Ford(2025)は、Anthropicの製品に組み込まれたマルチエージェント研究システムの設計と運用について報告している。オーケストレータ・ワーカーパターンを採用し、LeadResearcherエージェントが専門サブエージェントを並列に生成・協調させる構成である。社内評価において、単一...

📄 論文解説: LoCoBench-Agent — 長文コンテキストソフトウェア工学における対話型LLMエージェントベンチマーク

本記事は LoCoBench-Agent: An Interactive Benchmark for LLM Agents in Long-Context Software Engineering (arXiv:2511.13998) の解説記事です。 論文概要(Abstract) LoCoBench-Agentは、長文コンテキストソフトウェア工学における対話型LLMエージェントを評価す...

📄 論文解説: Optima — LLMベースマルチエージェントシステムの効果と効率を同時最適化するフレームワーク

本記事は arXiv:2410.09713 の解説記事です。 論文概要(Abstract) Chen, Yuan, Qian, Yang, Liu(2024)は、LLMベースのマルチエージェントシステム(MAS)の効果(性能)と効率(トークンコスト)を同時に最適化するフレームワーク「Optima」を提案している。プロンプトエンジニアリングに頼るのではなく、エージェントをファインチューニン...

📄 論文解説: LLM-based ACR — 14モデル×8データセットによる自動コードレビューの実証研究

本記事は https://arxiv.org/abs/2409.04927 の解説記事です。 論文概要(Abstract) LLM-based Automated Code Review(ACR)は、コードレビューの自動化をLLMで実現しようとする研究分野である。本論文は、14のLLMモデルを8つのコードレビューデータセットで体系的に評価し、zero-shotおよびone-shotの2シ...

📄 論文解説: Don't Break the Cache — プロンプトキャッシュのエージェントタスクにおける体系的評価

本記事は Don’t Break the Cache: An Evaluation of Prompt Caching for Long-Horizon Agentic Tasks (arXiv:2601.06007) の解説記事です。 論文概要(Abstract) 本論文は、プロンプトキャッシュ(Prompt Caching)がマルチターンエージェントタスクにおいてAPIコストと応答レ...