Home
0h-n0 TechBLog
キャンセル

✍️ Anthropic解説: Model Context Protocol (MCP) — AIアシスタントと外部データを接続する標準プロトコル

ブログ概要(Summary) 2024年11月25日、AnthropicはModel Context Protocol(MCP)を発表した。MCPは、AIアシスタントと外部データソース・ツールを接続するためのオープンスタンダードであり、コンテンツリポジトリ、ビジネスツール、開発環境など、データが存在するシステムとAIを統合するための標準的な方法を提供する。従来の断片的なインテグレーションを...

📄 論文解説: MemEngine — LLMエージェントメモリの統一モジュラーフレームワーク

本記事は arXiv:2501.17893 の解説記事です。 論文概要(Abstract) MemEngineは、LLMエージェントのメモリシステムを統一的かつモジュラーに構築するためのライブラリである。著者らは、既存のLLMエージェントがメモリを断片的かつアドホックに実装している問題を指摘し、Memory Operations(21種のアトミックプリミティブ)→ Memory Func...

✍️ サーベイ解説: A Survey of NL2SQL with Large Language Models — LLMベースText-to-SQLの体系的分類

本記事は arXiv:2412.04687 の解説記事です。 論文概要(Abstract) Cuiらは、LLMを用いたNL2SQL(自然言語→SQL変換)の研究を「訓練軸」と「推論軸」の2次元で体系的に分類したサーベイを発表した。訓練軸ではPre-training、Supervised Fine-Tuning(SFT)、RLHF(人間フィードバックからの強化学習)の3段階を、推論軸ではP...

📄 論文解説: Prompt Cache — モジュラーアテンション再利用によるLLM推論の低レイテンシ化

本記事は Prompt Cache: Modular Attention Reuse for Low-Latency Inference の解説記事です。 論文概要(Abstract) 著者らは、LLMの推論時にプロンプトの共有部分(システムプロンプト、Few-shotサンプル等)のアテンション状態(KVキャッシュ)を事前計算・保存し、後続のリクエストで再利用するPrompt Cache...

📄 論文解説: Efficient Guided Generation for Large Language Models — 有限状態機械による構造化出力の理論基盤

本記事は arXiv:2307.09702 の解説記事です。 論文概要(Abstract) Willard & Louf (2023) は、大規模言語モデル(LLM)のテキスト生成を正規表現や文脈自由文法(CFG)で制約する手法を提案している。著者らは、テキスト生成問題を有限状態機械(FSM)の状態遷移として再定式化し、各デコードステップで文法的に有効なトークンのみを許可するマス...