最近の更新
claudecode 18
- 論文解説: SWE-RL — 強化学習によるLLMのソフトウェアエンジニアリング推論能力の向上 20/03/2026
- 論文解説: SWE-bench Verified — LLMコーディングエージェント評価の業界標準ベンチマーク 20/03/2026
- 論文解説: OpenHands — An Open Platform for AI Software Agents 20/03/2026
- 論文解説: ChatDev — Communicative Agents for Software Development 20/03/2026
- 論文解説: SWE-agent — Agent-Computer Interfaces Enable Automated Software Engineering 20/03/2026
- 論文解説: 2025年初頭のAIが経験豊富なOSS開発者の生産性に与える影響のRCT測定 06/03/2026
- Anthropic Engineering解説: AIエージェントのための効果的なコンテキストエンジニアリング 06/03/2026
- 論文解説: Codified Context — 大規模コードベースにおけるAIエージェント向けコンテキストインフラ 06/03/2026
- Spotify Engineering解説: バックグラウンドコーディングエージェントのコンテキストエンジニアリング(Honk Part 2) 06/03/2026
- 論文解説: Evaluating AGENTS.md — リポジトリレベルコンテキストファイルはコーディングエージェントに有効か 06/03/2026
- 論文解説: SWE-RL — 強化学習によるLLMのソフトウェアエンジニアリング推論能力の強化 28/02/2026
- 論文解説: Agentless — エージェント不要のシンプルなパイプラインでSWE-benchを解く 28/02/2026
- Google Research解説: AIによるソフトウェアエンジニアリングの変革 — コード補完からエージェント型自動化まで 28/02/2026
- Anthropic Research解説: AIコーディング支援がスキル形成に与える影響 — 生産性とスキル獲得のトレードオフ 28/02/2026
- 論文解説: SWE-agent — Agent-Computer Interface設計がLLMエージェントのソフトウェアエンジニアリング性能を決める 28/02/2026
- 論文解説: Lost in the Middle — LLMはロングコンテキストの中間情報を見落とす 24/02/2026
- 論文解説: The Instruction Hierarchy — LLMに命令の優先順位を学習させる 24/02/2026
- 論文解説: Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 24/02/2026