最近の更新
ai 109
- 論文解説: Direct Preference Optimization (DPO) — 報酬モデル不要のLLMアライメント手法 29/03/2026
- 論文解説: Agents Are Not Enough — 単一エージェントの限界とSociety of Agentsフレームワーク 28/03/2026
- 論文解説: FeatureBench — AIコーディングエージェントの新機能実装能力を測定するベンチマーク 28/03/2026
- Google Research解説: エージェントシステムのスケーリング科学 — マルチエージェントが機能する条件と失敗する条件の定量分析 28/03/2026
- Anthropic Engineering解説: マルチエージェント研究システムの設計と実装 — 単一エージェント比90.2%の性能向上を実現したアーキテクチャ 28/03/2026
- 論文解説: Reasoning Models Generate Societies of Thought — 推論モデル内部に自発的に創発する思考の社会 28/03/2026
- 論文解説: Mini-Omni — ストリーミング音声出力を実現する並列デコーディングLLM 25/03/2026
- Google Developers Blog解説: Gemini 2.0 Multimodal Live APIの技術的基盤と設計思想 25/03/2026
- OpenAI Realtime API解説: GPT-realtimeモデルによる本番環境向けリアルタイム音声エージェント 25/03/2026
- 論文解説: VITA-1.5 — GPT-4oレベルのリアルタイム映像×音声対話を7Bモデルで実現 25/03/2026
- 論文解説: Moshi — 160msレイテンシを実現する全二重リアルタイム音声対話基盤モデル 25/03/2026
- Anthropic解説: Code Execution with MCP — AIエージェントのトークン消費98.7%削減手法 23/03/2026
- 論文解説: Adaptive Orchestration — マルチエージェントAIシステムの認知アーキテクチャ 23/03/2026
- 論文解説: FlowBench — LLMエージェントのワークフロー型別評価ベンチマーク 23/03/2026
- 論文解説: Tool-Augmented LLMs — 統合アーキテクチャと障害パターンのサーベイ 23/03/2026
- 論文解説: MCP-Zero — LLMエージェントのための動的ツール発見と推薦 23/03/2026
- IJCAI 2024論文解説: Large Language Model based Multi-Agents — LLMマルチエージェントの進展と課題の包括的サーベイ 22/03/2026
- NeurIPS 2023論文解説: Toolformer — 言語モデルが自らツール使用を学習する自己教師あり手法 22/03/2026
- ACL 2025論文解説: MultiAgentBench — LLMマルチエージェントの協調・競争を評価するベンチマーク 22/03/2026
- 論文解説: Multi-Agent Collaboration Mechanisms — LLMベースマルチエージェント協調メカニズムの体系的サーベイ 22/03/2026
- 論文解説: Hybrid Agentic AI and Multi-Agent Systems in Smart Manufacturing — LLMエージェントと従来型MASの融合による処方的保全 20/03/2026
- 論文解説: Why Do Multi-Agent LLM Systems Fail? — マルチエージェントLLMシステムの失敗分類学 20/03/2026
- 論文解説: FD-LLM — 振動センサーデータからの故障診断に特化したLLMフレームワーク 20/03/2026
- 論文解説: Flow-of-Action — SOPに基づくLLMマルチエージェント根本原因分析システム 20/03/2026
- 論文解説: Exploring LLM-based Frameworks for Fault Diagnosis — HVACシステムにおけるマルチLLM故障診断の実証的評価 20/03/2026
- NVIDIA RAG Blueprint解説: Kubernetes上のエンタープライズRAGコンポーネント水平オートスケーリング 20/03/2026
- Semantic Kernel Memory Packages GA — 11のVector Storeコネクタ本番利用開始とレガシーAPI移行ガイド 20/03/2026
- AWS事例解説: Amazon MemoryDBによるセマンティックキャッシュでAIワークロードのコスト86%削減 20/03/2026
- 論文解説: Adaptive-RAG — クエリ複雑度に基づく検索戦略の動的切り替えによるRAGコスト最適化 20/03/2026
- 論文解説: Corrective Retrieval Augmented Generation (CRAG) — 検索品質評価とWeb検索フォールバックによるRAGの堅牢化 20/03/2026
- 論文解説: SWE-RL — 強化学習によるLLMのソフトウェアエンジニアリング推論能力の向上 20/03/2026
- 論文解説: SWE-bench Verified — LLMコーディングエージェント評価の業界標準ベンチマーク 20/03/2026
- 論文解説: OpenHands — An Open Platform for AI Software Agents 20/03/2026
- 論文解説: ChatDev — Communicative Agents for Software Development 20/03/2026
- Notion事例解説: ベクトル検索基盤の10倍スケール・コスト90%削減の2年間 20/03/2026
- 論文解説: Searching for Best Practices in Retrieval-Augmented Generation — RAGパイプライン最適構成の体系的探索 20/03/2026
- 論文解説: SWE-agent — Agent-Computer Interfaces Enable Automated Software Engineering 20/03/2026
- Unit 42セキュリティレポート解説: MCPサンプリング経由の新しいプロンプトインジェクション攻撃ベクトル 17/03/2026
- 論文解説: AgentDojo — LLMエージェントのプロンプトインジェクション攻防を動的に評価するフレームワーク 17/03/2026
- 論文解説: InjecAgent — ツール統合LLMエージェントに対する間接プロンプトインジェクションのベンチマーク 17/03/2026
- Microsoft MSRCの間接プロンプトインジェクション防御戦略:Spotlighting・Prompt Shields・決定論的緩和の多層防御 17/03/2026
- 論文解説: ToolHijacker — LLMエージェントのツール選択に対するプロンプトインジェクション攻撃 17/03/2026
- 論文解説: Navigating MLOps — 統一ライフサイクルフレームワークとLLMOps統合 14/03/2026
- BAIR Blog解説: The Shift from Models to Compound AI Systems — モノリシックモデルから複合AIへの転換 14/03/2026
- Anthropic Research解説: Building Effective AI Agents — エージェント設計パターンの実践ガイド 14/03/2026
- ICDE 2025論文解説: Compound AIシステムのBlueprint Architecture — エージェントとデータのオーケストレーション設計 14/03/2026
- ICLR 2025論文解説: RouteLLM — 人間の嗜好データからLLMルーティングを学習する 14/03/2026
- 論文解説: Moirai 2.0 — Decoder-Onlyアーキテクチャへの転換で実現した軽量・高速時系列FM 12/03/2026
- 論文解説: GIFT-Eval — 時系列ファウンデーションモデルの包括的ベンチマーク 12/03/2026
- TimesFM-ICF解説: 時系列ファウンデーションモデルをFew-Shot学習器に変える 12/03/2026
- 論文解説: Sundial — Flow-Matchingによる連続値時系列ファウンデーションモデル 12/03/2026
- Chronos-2解説: 単変量から汎用予測へ — Amazonの時系列ファウンデーションモデル 12/03/2026
- ICLR 2025論文解説: CogVideoX - Expert Transformerによるテキスト-動画拡散モデル 10/03/2026
- 論文解説: HunyuanVideo - 13Bパラメータのオープンソース動画生成フレームワーク 10/03/2026
- 論文解説: LTX-2 - 音声と動画を同時生成する非対称デュアルストリームDiffusion Transformer 10/03/2026
- NeurIPS 2025論文解説: FramePack - 定長コンテキスト圧縮による実用的動画拡散モデル 10/03/2026
- 論文解説: Wan - オープンな大規模動画生成モデル群 10/03/2026
- 論文解説: 2025年初頭のAIが経験豊富なOSS開発者の生産性に与える影響のRCT測定 06/03/2026
- AAAI 2024論文解説: ExpeL - 経験学習によるLLMエージェントの自律的知識獲得 06/03/2026
- Anthropic Engineering解説: AIエージェントのための効果的なコンテキストエンジニアリング 06/03/2026
- NeurIPS 2025論文解説: A-MEM - Zettelkasten方式によるLLMエージェントの動的メモリ管理 06/03/2026
- 論文解説: Codified Context — 大規模コードベースにおけるAIエージェント向けコンテキストインフラ 06/03/2026
- 論文解説: Generative Agents - エピソード記憶とリフレクションによる信頼性のある行動シミュレーション 06/03/2026
- Spotify Engineering解説: バックグラウンドコーディングエージェントのコンテキストエンジニアリング(Honk Part 2) 06/03/2026
- 論文解説: Mem0 - 本番対応AIエージェントのためのスケーラブル長期記憶 06/03/2026
- AWS公式ブログ解説: Bedrock AgentCoreエピソード記憶でエージェントに経験学習能力を付与する 06/03/2026
- 論文解説: Evaluating AGENTS.md — リポジトリレベルコンテキストファイルはコーディングエージェントに有効か 06/03/2026
- 論文解説: 拡散言語モデルのサーベイ — 手法分類・課題・今後の研究方向 04/03/2026
- 論文解説: Diffusion Models in De Novo Drug Design — 創薬における拡散モデルの体系的レビュー 04/03/2026
- 論文解説: FlowDock — フローマッチングによるタンパク質-リガンドドッキングと結合親和性予測 04/03/2026
- ICML 2025論文解説: GenMol — 離散拡散モデルによる汎用創薬分子生成フレームワーク 04/03/2026
- IsoDDE解説: Isomorphic Labsの統合創薬設計エンジン — AlphaFold3を超える構造予測と結合親和性予測 04/03/2026
- 論文解説: AlphaFold3 — 拡散モデルによる生体分子複合体の構造予測 04/03/2026
- AWS Bedrock AgentCore SREエージェント: LangGraphマルチエージェントによるKubernetes運用自動化 03/03/2026
- Microsoft Research AIOpsLab: AIOps手法の標準化ベンチマーク評価フレームワーク 03/03/2026
- 論文解説: ARES — IBM Researchによるエージェント型クラウドインシデント自動対応システム 03/03/2026
- 論文解説: Multi-Agent Self-Healing — 4層階層マルチエージェントによるクラウド自己修復システム 03/03/2026
- 論文解説: SRE-Agent — LLMマルチエージェントによるSREタスク自動化フレームワーク 03/03/2026
- 論文解説: SWE-RL — 強化学習によるLLMのソフトウェアエンジニアリング推論能力の強化 28/02/2026
- 論文解説: Agentless — エージェント不要のシンプルなパイプラインでSWE-benchを解く 28/02/2026
- Google Research解説: AIによるソフトウェアエンジニアリングの変革 — コード補完からエージェント型自動化まで 28/02/2026
- Anthropic Research解説: AIコーディング支援がスキル形成に与える影響 — 生産性とスキル獲得のトレードオフ 28/02/2026
- 論文解説: SWE-agent — Agent-Computer Interface設計がLLMエージェントのソフトウェアエンジニアリング性能を決める 28/02/2026
- Google Research解説: ReAct — 推論と行動のシナジーによるLLMエージェントの基盤パラダイム 24/02/2026
- 論文解説: CodeAct — 実行可能コードでLLMエージェントの行動空間を統一する 24/02/2026
- 論文解説: ReWOO — 観察を分離した効率的エージェント推論でトークン消費を大幅削減 24/02/2026
- ICML 2024論文解説: LATS — モンテカルロ木探索でLLMエージェントの推論・行動・計画を統合 24/02/2026
- NeurIPS 2023論文解説: Reflexion — 言語フィードバックによる自己改善エージェント 24/02/2026
- 論文解説: MIO — 音声・テキスト・画像・動画を統一トークンで理解・生成する基盤モデル 22/02/2026
- Google解説: Gemini 2.5の動画理解 — VideoMME 85.2%達成のマルチモーダル技術詳細 22/02/2026
- 論文解説: Gemini 1.5 — Sparse MoEで100万トークンコンテキストのマルチモーダル理解を実現 22/02/2026
- 論文解説: Qwen2-VL — 任意解像度の画像・動画を動的トークン化するVision-Language Model 22/02/2026
- 論文解説: Gemini — ネイティブマルチモーダルモデルの設計と画像・音声・動画統合処理 22/02/2026
- 論文解説: Reasoning Language Models: A Blueprint — 推論言語モデル構築の体系的設計図 21/02/2026
- 論文解説: RouteLLM — 人間選好データによるLLMコスト最適化ルーティング 20/02/2026
- 論文解説: Agentic AI Systems in Financial Services — マルチエージェントLLMの信頼性設計パターン 20/02/2026
- 論文解説: Strategic and Selective Mixtures — LLMルーティングとカスケードの実装判断ガイド 20/02/2026
- AWS公式解説: Multi-Provider Generative AI Gateway — LiteLLMによるマルチプロバイダLLM統合アーキテクチャ 20/02/2026
- 論文解説: A Systematic Review of Reliability Frameworks for Production LLM Systems 20/02/2026
- 論文解説: JOrthoBench — 日本語表記ゆれによるLLM評価の盲点を暴く 19/02/2026
- 論文解説: MetaLLM — Multi-Armed Banditによるコスト効率最適のLLMルーティングフレームワーク 19/02/2026
- 論文解説: DeepSeek-V3 Technical Report — 671B MoEモデルの革新的アーキテクチャと$560万学習の全貌 19/02/2026
- Gemma-2-Llama Swallow: 科学大学×AISが構築した日本語特化LLMの技術詳細 19/02/2026
- LangChain公式解説: マルチエージェントアーキテクチャの4パターン — Subagents・Skills・Handoffs・Router徹底比較 17/02/2026
- NeurIPS 2025論文解説: Multi-Agent Collaboration via Evolving Orchestration — 強化学習で進化する操り人形師パラダイム 17/02/2026
- NVIDIA ToolOrchestra: 小型モデルで大型LLMを指揮する — Orchestrator-8Bの強化学習ベースオーケストレーション 17/02/2026
- Magentic-One: Microsoft発の汎用マルチエージェントシステム — Orchestrator+4専門エージェントによるタスク解決 17/02/2026
- 論文解説: Mixture-of-Agents — 複数LLMの階層的協調で単体GPT-4oを超える 17/02/2026
- 論文解説: The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits 17/02/2026