📄 論文解説: ReWOO — 観察なし推論による効率的なLLMツール並列実行

本記事は ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models（Xu et al., 2023）の解説記事です。論文概要（Abstract） ReWOO（Reasoning WithOut Observation）は、Augmented Language Model（A...

29/04/2026 blog paper

LLM agent ReWoo +4

📄 論文解説: LLM-based Automated Code Review — 87本のメタ分析から見えるファインチューニングの有効性

本記事は https://arxiv.org/abs/2501.07902 の解説記事です。論文概要（Abstract） Kumarらは、LLMを用いた自動コードレビューに関する系統的文献レビュー（Systematic Literature Review; SLR）を実施し、2020年から2024年にかけて発表された87本の論文を分析した。主要な発見として、（1）ドメイン特化データによ...

28/04/2026 blog paper

code-review LLM survey +6

📄 論文解説: SWE-LoRA — LoRAベースのポリシー改良によるコスト効率的ソフトウェアエンジニアリングエージェント

本記事は https://arxiv.org/abs/2502.17505 の解説記事です。論文概要（Abstract） SWE-LoRA は、実世界のソフトウェアエンジニアリング（SE）タスクを小規模言語モデルで解決するための手法である。Claude 3.5 Sonnet のようなフロンティアモデルは SWE-bench で高い性能を示す一方、推論コストが実運用の障壁となっている。著...

28/04/2026 blog paper

SWE-bench LoRA software-engineering +5

📄 論文解説: MoELoRA — LoRAアダプタへのMoEルーティング導入によるパラメータ効率的ファインチューニングの拡張

本記事は https://arxiv.org/abs/2502.20894 の解説記事です。論文概要（Abstract） MoELoRAは、パラメータ効率的ファインチューニング（PEFT）手法であるLoRAに対して、Mixture-of-Experts（MoE）フレームワークを統合した手法である。従来のLoRAが各重み行列に対して単一のlow-rank分解を適用するのに対し、MoELo...

28/04/2026 blog paper

MoE LoRA routing +6

📄 論文解説: MoE-LoRA — MoEモデルのエキスパート層に特化したパラメータ効率的ファインチューニング

論文概要（Abstract）本記事は https://arxiv.org/abs/2402.00367 の解説記事です。 Mixture-of-Experts（MoE）モデルは近年のLLM開発において有力なアーキテクチャとして注目されているが、パラメータ数の膨大さからフルファインチューニングが困難である。本論文では、MoEモデルのexpert層のみにLoRAアダプタを適用するMoE-L...

28/04/2026 blog paper

MoE LoRA fine-tuning +5

📄 論文解説: Data-efficient LLM Fine-tuning for Code Generation

本記事は https://arxiv.org/abs/2504.12687 の解説記事です。論文概要（Abstract）大規模言語モデル（LLM）をコード生成タスクにファインチューニングするには、大量かつ高品質な学習データが必要となる。しかし、データの希少性や収集コストの高さが現実的な課題として存在する。本論文では、学習データ量を削減しつつモデル性能を維持・向上させるデータ効率的なフ...

28/04/2026 blog paper

fine-tuning data-efficiency code-generation +5

📄 論文解説: GASP — Guided Asymmetric Self-Play for Continued Improvement of LLMs

本記事は arXiv:2603.15957 “GASP: Guided Asymmetric Self-Play for Continued Improvement of LLMs”（Song et al.、2025年3月）の解説記事です。論文概要（Abstract） GASP（Guided Asymmetric Self-Play）は、外部の強力な教師モデル（Teacher）を用いて...

27/04/2026 blog paper

selfplay adversarial teacher-student +2

📄 論文解説: CoALA — 認知科学に基づくLLMエージェントのメモリアーキテクチャ分類体系

本記事は https://arxiv.org/abs/2309.02427 の解説記事です。論文概要（Abstract） CoALA（Cognitive Architectures for Language Agents）は、認知科学における認知アーキテクチャの知見をLLMベースのエージェントに適用し、情報記憶（Memory）、行動空間（Action Space）、意思決定手続き（De...

27/04/2026 blog paper

CoALA cognitive-architecture memory-taxonomy +3

📄 論文解説: SPC — Evolving Self-Play Critic via Adversarial Games for LLM Reasoning

本記事は arXiv:2504.19162 “SPC: Evolving Self-Play Critic via Adversarial Games for LLM Reasoning”（Chen, Liu、2025年4月）の解説記事です。論文概要（Abstract） SPC（Self-Play Critic）は、LLMの推論能力を強化するために、批評者（Critic）と生成器（Ge...

27/04/2026 blog paper

selfplay adversarial critic +2

📄 論文解説: Generative Agents — 自然言語メモリストリームによる信頼性の高い自律エージェント

本記事は https://arxiv.org/abs/2304.03442 の解説記事です。論文概要（Abstract） Generative Agentsは、大規模言語モデル（LLM）を拡張し、自然言語による経験の完全な記録・高次の反省（Reflection）への統合・動的な記憶検索を通じて、人間的な行動をシミュレートする計算エージェントである。著者らは25体のエージェントが暮らすサ...

27/04/2026 blog paper

generative-agents memory-stream reflection +3

1
...
16
17
18
...
118
17 / 118