Home
0h-n0 TechBLog
キャンセル

✍️ Anthropic Engineering解説: 長時間実行エージェントの効果的なハーネス設計パターン

本記事は Effective harnesses for long-running agents(Anthropic Engineering Blog、2025年11月26日公開) の解説記事です。 ブログ概要(Summary) Anthropic Engineeringブログで公開されたこの記事は、コンテキストウィンドウを超える長時間実行エージェントを安定して運用するためのハーネス(制...

📄 ICLR 2025論文解説: Relaxed Recursive Transformers — レイヤー共有とLoRAによるモデル圧縮

論文概要(Abstract) 本記事は Relaxed Recursive Transformers (ICLR 2025) の解説記事です。 Google DeepMindの研究チームは、既存の事前学習済みTransformerを「Recursive Transformer」に変換する手法を提案している。Recursive Transformerは単一のレイヤーブロックを複数回繰り返し...

📄 論文解説: Think, But Don't Overthink — LLM推論における過剰思考の抑制と動的トークン予算制御

論文概要(Abstract) 本記事は Think, But Don’t Overthink (arXiv:2603.02615) の解説記事です。 DeepSeek-R1やQwQ-32Bなどの大規模推論モデル(LRM)は、回答前に拡張的な思考チェーン(thinking tokens)を生成する。この拡張推論は困難な問題で性能を向上させるが、しばしば「過剰思考(overthinking)...

📄 論文解説: MemGPT — 仮想メモリ管理に着想を得たLLMエージェントの無制限セッション維持

論文概要(Abstract) 本記事は MemGPT: Towards LLMs as Operating Systems(Packer et al., 2023) の解説記事です。MemGPTは、オペレーティングシステムの仮想メモリ管理から着想を得て、LLMの固定長コンテキストウィンドウを超える長期ステートフルセッションを実現するシステムである。著者らは、LLMエージェントが自身のコンテ...

📄 論文解説: Scaling LLM Test-Time Compute with REPL — コード実行ループによる推論スケーリング

論文概要(Abstract) 本記事は Scaling LLM Test-Time Compute with REPL (arXiv:2502.06807) の解説記事です。 この論文は、LLMの推論時にPython REPL(Read-Eval-Print Loop)環境を統合し、自然言語推論と実行可能コードを交互に生成することでテスト時計算をスケーリングする手法を提案している。著者ら...

✍️ OpenAI公式ブログ解説: GPT-5.5 — 完全再学習ベースモデルのアーキテクチャと性能分析

OpenAI公式ブログ解説: GPT-5.5 — 完全再学習ベースモデルのアーキテクチャと性能分析 ブログ概要 本記事は OpenAI公式ブログ: Introducing GPT-5.5 の解説記事です。 2026年4月23日、OpenAIはGPT-5.5を発表した。GPT-5.5はGPT-4.5以来初となる完全再学習(full retrain)ベースモデルであり、GPT-5.0〜5....