Home
0h-n0 TechBLog
キャンセル

📄 論文解説: Data-efficient LLM Fine-tuning for Code Generation

本記事は https://arxiv.org/abs/2504.12687 の解説記事です。 論文概要(Abstract) 大規模言語モデル(LLM)をコード生成タスクにファインチューニングするには、大量かつ高品質な学習データが必要となる。しかし、データの希少性や収集コストの高さが現実的な課題として存在する。本論文では、学習データ量を削減しつつモデル性能を維持・向上させるデータ効率的なフ...

📄 論文解説: GASP — Guided Asymmetric Self-Play for Continued Improvement of LLMs

本記事は arXiv:2603.15957 “GASP: Guided Asymmetric Self-Play for Continued Improvement of LLMs”(Song et al.、2025年3月)の解説記事です。 論文概要(Abstract) GASP(Guided Asymmetric Self-Play)は、外部の強力な教師モデル(Teacher)を用いて...

📄 論文解説: CoALA — 認知科学に基づくLLMエージェントのメモリアーキテクチャ分類体系

本記事は https://arxiv.org/abs/2309.02427 の解説記事です。 論文概要(Abstract) CoALA(Cognitive Architectures for Language Agents)は、認知科学における認知アーキテクチャの知見をLLMベースのエージェントに適用し、情報記憶(Memory)、行動空間(Action Space)、意思決定手続き(De...

📄 論文解説: SPC — Evolving Self-Play Critic via Adversarial Games for LLM Reasoning

本記事は arXiv:2504.19162 “SPC: Evolving Self-Play Critic via Adversarial Games for LLM Reasoning”(Chen, Liu、2025年4月)の解説記事です。 論文概要(Abstract) SPC(Self-Play Critic)は、LLMの推論能力を強化するために、批評者(Critic)と生成器(Ge...

📄 論文解説: Generative Agents — 自然言語メモリストリームによる信頼性の高い自律エージェント

本記事は https://arxiv.org/abs/2304.03442 の解説記事です。 論文概要(Abstract) Generative Agentsは、大規模言語モデル(LLM)を拡張し、自然言語による経験の完全な記録・高次の反省(Reflection)への統合・動的な記憶検索を通じて、人間的な行動をシミュレートする計算エージェントである。著者らは25体のエージェントが暮らすサ...

📄 NeurIPS 2025論文解説: A-Mem — Zettelkasten方式によるLLMエージェントの自律型メモリ管理

本記事は https://arxiv.org/abs/2502.12110 の解説記事です。 論文概要(Abstract) A-Memは、LLMエージェントのメモリを「エージェント自身が自律的に組織化する」という新しいパラダイムを提案するシステムである。社会学者Niklas Luhmannが考案したZettelkasten(ツェッテルカステン)方式の原理を応用し、個々のメモリをアトミック...

📄 論文解説: MemGPT — LLMをOSとして捉える階層型メモリアーキテクチャ

本記事は https://arxiv.org/abs/2310.08560 の解説記事です。 論文概要(Abstract) MemGPTは、LLMの固定長コンテキストウィンドウをOSにおける物理メモリ(RAM)に見立て、外部ストレージとの間で情報をページングする階層型メモリ管理システムである。著者らは、Main Context(高速・限定容量)、Recall Storage(会話履歴のベ...