ai 109

論文解説: Direct Preference Optimization (DPO) — 報酬モデル不要のLLMアライメント手法 29/03/2026
論文解説: Agents Are Not Enough — 単一エージェントの限界とSociety of Agentsフレームワーク 28/03/2026
論文解説: FeatureBench — AIコーディングエージェントの新機能実装能力を測定するベンチマーク 28/03/2026
Google Research解説: エージェントシステムのスケーリング科学 — マルチエージェントが機能する条件と失敗する条件の定量分析 28/03/2026
Anthropic Engineering解説: マルチエージェント研究システムの設計と実装 — 単一エージェント比90.2%の性能向上を実現したアーキテクチャ 28/03/2026
論文解説: Reasoning Models Generate Societies of Thought — 推論モデル内部に自発的に創発する思考の社会 28/03/2026
論文解説: Mini-Omni — ストリーミング音声出力を実現する並列デコーディングLLM 25/03/2026
Google Developers Blog解説: Gemini 2.0 Multimodal Live APIの技術的基盤と設計思想 25/03/2026
OpenAI Realtime API解説: GPT-realtimeモデルによる本番環境向けリアルタイム音声エージェント 25/03/2026
論文解説: VITA-1.5 — GPT-4oレベルのリアルタイム映像×音声対話を7Bモデルで実現 25/03/2026
論文解説: Moshi — 160msレイテンシを実現する全二重リアルタイム音声対話基盤モデル 25/03/2026
Anthropic解説: Code Execution with MCP — AIエージェントのトークン消費98.7%削減手法 23/03/2026
論文解説: Adaptive Orchestration — マルチエージェントAIシステムの認知アーキテクチャ 23/03/2026
論文解説: FlowBench — LLMエージェントのワークフロー型別評価ベンチマーク 23/03/2026
論文解説: Tool-Augmented LLMs — 統合アーキテクチャと障害パターンのサーベイ 23/03/2026
論文解説: MCP-Zero — LLMエージェントのための動的ツール発見と推薦 23/03/2026
IJCAI 2024論文解説: Large Language Model based Multi-Agents — LLMマルチエージェントの進展と課題の包括的サーベイ 22/03/2026
NeurIPS 2023論文解説: Toolformer — 言語モデルが自らツール使用を学習する自己教師あり手法 22/03/2026
ACL 2025論文解説: MultiAgentBench — LLMマルチエージェントの協調・競争を評価するベンチマーク 22/03/2026
論文解説: Multi-Agent Collaboration Mechanisms — LLMベースマルチエージェント協調メカニズムの体系的サーベイ 22/03/2026
論文解説: Hybrid Agentic AI and Multi-Agent Systems in Smart Manufacturing — LLMエージェントと従来型MASの融合による処方的保全 20/03/2026
論文解説: Why Do Multi-Agent LLM Systems Fail? — マルチエージェントLLMシステムの失敗分類学 20/03/2026
論文解説: FD-LLM — 振動センサーデータからの故障診断に特化したLLMフレームワーク 20/03/2026
論文解説: Flow-of-Action — SOPに基づくLLMマルチエージェント根本原因分析システム 20/03/2026
論文解説: Exploring LLM-based Frameworks for Fault Diagnosis — HVACシステムにおけるマルチLLM故障診断の実証的評価 20/03/2026
NVIDIA RAG Blueprint解説: Kubernetes上のエンタープライズRAGコンポーネント水平オートスケーリング 20/03/2026
Semantic Kernel Memory Packages GA — 11のVector Storeコネクタ本番利用開始とレガシーAPI移行ガイド 20/03/2026
AWS事例解説: Amazon MemoryDBによるセマンティックキャッシュでAIワークロードのコスト86%削減 20/03/2026
論文解説: Adaptive-RAG — クエリ複雑度に基づく検索戦略の動的切り替えによるRAGコスト最適化 20/03/2026
論文解説: Corrective Retrieval Augmented Generation (CRAG) — 検索品質評価とWeb検索フォールバックによるRAGの堅牢化 20/03/2026
論文解説: SWE-RL — 強化学習によるLLMのソフトウェアエンジニアリング推論能力の向上 20/03/2026
論文解説: SWE-bench Verified — LLMコーディングエージェント評価の業界標準ベンチマーク 20/03/2026
論文解説: OpenHands — An Open Platform for AI Software Agents 20/03/2026
論文解説: ChatDev — Communicative Agents for Software Development 20/03/2026
Notion事例解説: ベクトル検索基盤の10倍スケール・コスト90%削減の2年間 20/03/2026
論文解説: Searching for Best Practices in Retrieval-Augmented Generation — RAGパイプライン最適構成の体系的探索 20/03/2026
論文解説: SWE-agent — Agent-Computer Interfaces Enable Automated Software Engineering 20/03/2026
Unit 42セキュリティレポート解説: MCPサンプリング経由の新しいプロンプトインジェクション攻撃ベクトル 17/03/2026
論文解説: AgentDojo — LLMエージェントのプロンプトインジェクション攻防を動的に評価するフレームワーク 17/03/2026
論文解説: InjecAgent — ツール統合LLMエージェントに対する間接プロンプトインジェクションのベンチマーク 17/03/2026
Microsoft MSRCの間接プロンプトインジェクション防御戦略：Spotlighting・Prompt Shields・決定論的緩和の多層防御 17/03/2026
論文解説: ToolHijacker — LLMエージェントのツール選択に対するプロンプトインジェクション攻撃 17/03/2026
論文解説: Navigating MLOps — 統一ライフサイクルフレームワークとLLMOps統合 14/03/2026
BAIR Blog解説: The Shift from Models to Compound AI Systems — モノリシックモデルから複合AIへの転換 14/03/2026
Anthropic Research解説: Building Effective AI Agents — エージェント設計パターンの実践ガイド 14/03/2026
ICDE 2025論文解説: Compound AIシステムのBlueprint Architecture — エージェントとデータのオーケストレーション設計 14/03/2026
ICLR 2025論文解説: RouteLLM — 人間の嗜好データからLLMルーティングを学習する 14/03/2026
論文解説: Moirai 2.0 — Decoder-Onlyアーキテクチャへの転換で実現した軽量・高速時系列FM 12/03/2026
論文解説: GIFT-Eval — 時系列ファウンデーションモデルの包括的ベンチマーク 12/03/2026
TimesFM-ICF解説: 時系列ファウンデーションモデルをFew-Shot学習器に変える 12/03/2026
論文解説: Sundial — Flow-Matchingによる連続値時系列ファウンデーションモデル 12/03/2026
Chronos-2解説: 単変量から汎用予測へ — Amazonの時系列ファウンデーションモデル 12/03/2026
ICLR 2025論文解説: CogVideoX - Expert Transformerによるテキスト-動画拡散モデル 10/03/2026
論文解説: HunyuanVideo - 13Bパラメータのオープンソース動画生成フレームワーク 10/03/2026
論文解説: LTX-2 - 音声と動画を同時生成する非対称デュアルストリームDiffusion Transformer 10/03/2026
NeurIPS 2025論文解説: FramePack - 定長コンテキスト圧縮による実用的動画拡散モデル 10/03/2026
論文解説: Wan - オープンな大規模動画生成モデル群 10/03/2026
論文解説: 2025年初頭のAIが経験豊富なOSS開発者の生産性に与える影響のRCT測定 06/03/2026
AAAI 2024論文解説: ExpeL - 経験学習によるLLMエージェントの自律的知識獲得 06/03/2026
Anthropic Engineering解説: AIエージェントのための効果的なコンテキストエンジニアリング 06/03/2026
NeurIPS 2025論文解説: A-MEM - Zettelkasten方式によるLLMエージェントの動的メモリ管理 06/03/2026
論文解説: Codified Context — 大規模コードベースにおけるAIエージェント向けコンテキストインフラ 06/03/2026
論文解説: Generative Agents - エピソード記憶とリフレクションによる信頼性のある行動シミュレーション 06/03/2026
Spotify Engineering解説: バックグラウンドコーディングエージェントのコンテキストエンジニアリング（Honk Part 2） 06/03/2026
論文解説: Mem0 - 本番対応AIエージェントのためのスケーラブル長期記憶 06/03/2026
AWS公式ブログ解説: Bedrock AgentCoreエピソード記憶でエージェントに経験学習能力を付与する 06/03/2026
論文解説: Evaluating AGENTS.md — リポジトリレベルコンテキストファイルはコーディングエージェントに有効か 06/03/2026
論文解説: 拡散言語モデルのサーベイ — 手法分類・課題・今後の研究方向 04/03/2026
論文解説: Diffusion Models in De Novo Drug Design — 創薬における拡散モデルの体系的レビュー 04/03/2026
論文解説: FlowDock — フローマッチングによるタンパク質-リガンドドッキングと結合親和性予測 04/03/2026
ICML 2025論文解説: GenMol — 離散拡散モデルによる汎用創薬分子生成フレームワーク 04/03/2026
IsoDDE解説: Isomorphic Labsの統合創薬設計エンジン — AlphaFold3を超える構造予測と結合親和性予測 04/03/2026
論文解説: AlphaFold3 — 拡散モデルによる生体分子複合体の構造予測 04/03/2026
AWS Bedrock AgentCore SREエージェント: LangGraphマルチエージェントによるKubernetes運用自動化 03/03/2026
Microsoft Research AIOpsLab: AIOps手法の標準化ベンチマーク評価フレームワーク 03/03/2026
論文解説: ARES — IBM Researchによるエージェント型クラウドインシデント自動対応システム 03/03/2026
論文解説: Multi-Agent Self-Healing — 4層階層マルチエージェントによるクラウド自己修復システム 03/03/2026
論文解説: SRE-Agent — LLMマルチエージェントによるSREタスク自動化フレームワーク 03/03/2026
論文解説: SWE-RL — 強化学習によるLLMのソフトウェアエンジニアリング推論能力の強化 28/02/2026
論文解説: Agentless — エージェント不要のシンプルなパイプラインでSWE-benchを解く 28/02/2026
Google Research解説: AIによるソフトウェアエンジニアリングの変革 — コード補完からエージェント型自動化まで 28/02/2026
Anthropic Research解説: AIコーディング支援がスキル形成に与える影響 — 生産性とスキル獲得のトレードオフ 28/02/2026
論文解説: SWE-agent — Agent-Computer Interface設計がLLMエージェントのソフトウェアエンジニアリング性能を決める 28/02/2026
Google Research解説: ReAct — 推論と行動のシナジーによるLLMエージェントの基盤パラダイム 24/02/2026
論文解説: CodeAct — 実行可能コードでLLMエージェントの行動空間を統一する 24/02/2026
論文解説: ReWOO — 観察を分離した効率的エージェント推論でトークン消費を大幅削減 24/02/2026
ICML 2024論文解説: LATS — モンテカルロ木探索でLLMエージェントの推論・行動・計画を統合 24/02/2026
NeurIPS 2023論文解説: Reflexion — 言語フィードバックによる自己改善エージェント 24/02/2026
論文解説: MIO — 音声・テキスト・画像・動画を統一トークンで理解・生成する基盤モデル 22/02/2026
Google解説: Gemini 2.5の動画理解 — VideoMME 85.2%達成のマルチモーダル技術詳細 22/02/2026
論文解説: Gemini 1.5 — Sparse MoEで100万トークンコンテキストのマルチモーダル理解を実現 22/02/2026
論文解説: Qwen2-VL — 任意解像度の画像・動画を動的トークン化するVision-Language Model 22/02/2026
論文解説: Gemini — ネイティブマルチモーダルモデルの設計と画像・音声・動画統合処理 22/02/2026
論文解説: Reasoning Language Models: A Blueprint — 推論言語モデル構築の体系的設計図 21/02/2026
論文解説: RouteLLM — 人間選好データによるLLMコスト最適化ルーティング 20/02/2026
論文解説: Agentic AI Systems in Financial Services — マルチエージェントLLMの信頼性設計パターン 20/02/2026
論文解説: Strategic and Selective Mixtures — LLMルーティングとカスケードの実装判断ガイド 20/02/2026
AWS公式解説: Multi-Provider Generative AI Gateway — LiteLLMによるマルチプロバイダLLM統合アーキテクチャ 20/02/2026
論文解説: A Systematic Review of Reliability Frameworks for Production LLM Systems 20/02/2026
論文解説: JOrthoBench — 日本語表記ゆれによるLLM評価の盲点を暴く 19/02/2026
論文解説: MetaLLM — Multi-Armed Banditによるコスト効率最適のLLMルーティングフレームワーク 19/02/2026
論文解説: DeepSeek-V3 Technical Report — 671B MoEモデルの革新的アーキテクチャと$560万学習の全貌 19/02/2026
Gemma-2-Llama Swallow: 科学大学×AISが構築した日本語特化LLMの技術詳細 19/02/2026
LangChain公式解説: マルチエージェントアーキテクチャの4パターン — Subagents・Skills・Handoffs・Router徹底比較 17/02/2026
NeurIPS 2025論文解説: Multi-Agent Collaboration via Evolving Orchestration — 強化学習で進化する操り人形師パラダイム 17/02/2026
NVIDIA ToolOrchestra: 小型モデルで大型LLMを指揮する — Orchestrator-8Bの強化学習ベースオーケストレーション 17/02/2026
Magentic-One: Microsoft発の汎用マルチエージェントシステム — Orchestrator+4専門エージェントによるタスク解決 17/02/2026
論文解説: Mixture-of-Agents — 複数LLMの階層的協調で単体GPT-4oを超える 17/02/2026
論文解説: The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits 17/02/2026