最近の更新
conference 89
- ICCV 2019論文解説: Be Your Own Teacher — CNNにおける自己蒸留の先駆的研究 29/03/2026
- WACV 2023論文解説: SDSSL — 中間層自己蒸留によるSelf-Supervised Learningの表現品質向上 29/03/2026
- CVPR 2025論文解説: COSMOS — クロスモーダル自己蒸留によるVision-Language事前学習の改善 29/03/2026
- 論文解説: Orca — Iteration-Level Schedulingによる生成モデルサービングの革新 29/03/2026
- ICML 2025論文解説: BFCL — Berkeley Function Calling Leaderboard 28/03/2026
- NeurIPS 2024論文解説: GTA — 実行可能ツールによる汎用ツールエージェントベンチマーク 28/03/2026
- NeurIPS 2024論文解説: MoE推論の効率化に向けた3つの最適化手法 25/03/2026
- ACL 2024論文解説: RAGTruth — RAGシステムの幻覚検出コーパスと評価手法 24/03/2026
- IJCAI 2024論文解説: Large Language Model based Multi-Agents — LLMマルチエージェントの進展と課題の包括的サーベイ 22/03/2026
- NeurIPS 2023論文解説: Toolformer — 言語モデルが自らツール使用を学習する自己教師あり手法 22/03/2026
- ACL 2025論文解説: MultiAgentBench — LLMマルチエージェントの協調・競争を評価するベンチマーク 22/03/2026
- ICLR 2025論文解説: MMTEB — Massive Multilingual Text Embedding Benchmark 21/03/2026
- ICML 2024論文解説: LLMガードレールの体系的設計手法 21/03/2026
- 論文解説: Flow-of-Action — SOPに基づくLLMマルチエージェント根本原因分析システム 20/03/2026
- MLSys 2024論文解説: Prompt Cache — Modular Attention Reuse for Low-Latency Inference 20/03/2026
- NeurIPS 2024論文解説: AvaTaR - 対照推論によるLLMエージェントのツール利用最適化 17/03/2026
- NAACL 2025論文解説: Decision TokenとデータブレンドによるLLMのFunction Calling能力強化 17/03/2026
- OOPSLA 2024論文解説: Cedar - A New Language for Expressive, Fast, Safe, and Analyzable Authorization 15/03/2026
- MRL 2024論文解説: Jina-ColBERT-v2 — 多言語Late Interactionリトリーバーの設計と最適化 14/03/2026
- ACL 2025論文解説: SetR — ランキングから集合選択へ、RAG検索のパラダイムシフト 14/03/2026
- ACL 2024論文解説: When is Tree Search Useful for LLM Planning? — 木探索の有効性条件 14/03/2026
- EMNLP 2025論文解説: How Good are LLM-based Rerankers? — リランキングモデルの実証分析 14/03/2026
- CIKM 2024論文解説: TopoGDN - トポロジカル解析によるグラフ注意ネットワーク強化型時系列異常検知 12/03/2026
- NeurIPS 2024論文解説: Graphcode - 多パラメータパーシステントホモロジーとGNNの統合 12/03/2026
- ACL 2025論文解説: GNN-RAG — GNNの推論とLLMの言語理解を融合した知識グラフ質問応答 12/03/2026
- NAACL 2025論文解説: Attention Tracker — 訓練不要のプロンプトインジェクション検出 12/03/2026
- ICLR 2025論文解説: RouteLLM — 嗜好データを用いたLLMルーティングによるコスト効率的推論 12/03/2026
- ACL 2025論文解説: PIGuard — 過剰防御を抑制するプロンプトインジェクション検出 12/03/2026
- ICML 2025論文解説: EncryptedLLM — GPU加速FHEによるプライバシー保護LLM推論 12/03/2026
- NeurIPS 2024論文解説: Teach Better or Show Smarter? — 命令最適化 vs 例示最適化の体系的比較 11/03/2026
- PLDI 2024論文解説: Cedar — 表現力・高速・安全・解析可能を両立した認可言語の設計と実装 11/03/2026
- ICLR 2025論文解説: CogVideoX - Expert Transformerによるテキスト-動画拡散モデル 10/03/2026
- EMNLP 2025論文解説: GRPO-LEAD - 難易度考慮型GRPOによる簡潔な数学推論 10/03/2026
- NeurIPS 2025論文解説: FramePack - 定長コンテキスト圧縮による実用的動画拡散モデル 10/03/2026
- OSDI 2022論文解説: Orca - Iteration-Level SchedulingによるLLMサービング最適化 07/03/2026
- EMNLP 2025論文解説: RouterEval — LLMルーティング戦略の包括的ベンチマーク 05/03/2026
- ICLR 2025論文解説: ReMoE — ReLUルーティングによる完全微分可能なMoEアーキテクチャ 04/03/2026
- ICML 2025論文解説: GenMol — 離散拡散モデルによる汎用創薬分子生成フレームワーク 04/03/2026
- ACL 2024論文解説: Improving Text Embeddings with Large Language Models — LLM合成データで埋め込みモデルを訓練する 04/03/2026
- NeurIPS 2019論文解説: DiskANN — 10億規模のベクトル検索を単一ノードで実現するSSD最適化アルゴリズム 02/03/2026
- NAACL 2025論文解説: Attention Tracker — アテンション解析によるプロンプトインジェクション検出 01/03/2026
- NAACL 2025論文解説: Adaptive Attacks Break Defenses Against Indirect Prompt Injection Attacks on LLM Agents 01/03/2026
- NeurIPS 2024論文解説: Toward Efficient Inference for Mixture of Experts — MoE推論のスループットを最大11.55倍改善する3手法 27/02/2026
- NeurIPS 2024論文解説: SGLang — RadixAttentionとCompressed FSMによるLLM推論高速化 24/02/2026
- MLSys 2024 Best Paper解説: AWQ — 活性化ベース重み量子化でLLMを4bitに圧縮 24/02/2026
- ICML 2025論文解説: Flexible and Efficient Grammar-Constrained Decoding 24/02/2026
- NeurIPS 2024論文解説: KVQuant — KVキャッシュ量子化で1000万トークンコンテキストを実現 24/02/2026
- ICML 2024論文解説: LATS — モンテカルロ木探索でLLMエージェントの推論・行動・計画を統合 24/02/2026
- SOSP 2023論文解説: Efficient Memory Management for Large Language Model Serving with PagedAttention 24/02/2026
- ICML 2025論文解説: LaRA — RAGとLong-Context LLMのベンチマーク比較 24/02/2026
- NeurIPS 2023論文解説: Reflexion — 言語フィードバックによる自己改善エージェント 24/02/2026
- EMNLP 2025論文解説: FaithJudge — 人間アノテーション活用のRAG忠実度ベンチマーク 23/02/2026
- カンファレンス論文解説: BFCL — Berkeley Function Calling Leaderboardによるツール呼び出し能力の標準ベンチマーク 23/02/2026
- SOSP 2023論文解説: vLLM — PagedAttentionによるKVキャッシュメモリ管理の革新 23/02/2026
- OSDI 2024論文解説: Sarathi-Serve — Chunked-Prefillsで実現するLLM推論のスループット・レイテンシ最適化 23/02/2026
- COLING 2025論文解説: MAC-SQL — マルチエージェント協調によるText-to-SQLフレームワーク 23/02/2026
- ISCA 2025論文解説: RAGO — RAGサービングのシステムレベル性能最適化 23/02/2026
- NeurIPS 2024論文解説: Compact Language Models via Pruning and Knowledge Distillation (Minitron) 23/02/2026
- COLING 2025論文解説: MAC-SQL — Selector・Decomposer・Refinerによるマルチエージェント協調Text-to-SQL 23/02/2026
- EMNLP 2025論文解説: DecEx-RAG — MDPモデリングとプロセス監視でAgentic RAGを最適化 23/02/2026
- NeurIPS 2024論文解説: HippoRAG — 海馬モデルに基づくLLMの長期記憶型RAGアーキテクチャ 23/02/2026
- CIDR 2025論文解説: AOP — DAGベース並列実行によるLLMパイプライン自動オーケストレーション 23/02/2026
- ICML 2025論文解説: A Unified Approach to Routing and Cascading for LLMs — ルーティングとカスケードの統一的最適化 23/02/2026
- COLING 2025論文解説: MAC-SQL — マルチエージェント協調によるText-to-SQL 23/02/2026
- ICLR 2025論文解説: CHASE-SQL — マルチパス推論と選好最適化によるText-to-SQL 23/02/2026
- CIDR 2025論文解説: Text2SQL is Not Enough — TAGフレームワークによるDB×LLM推論の統合 23/02/2026
- NeurIPS 2025論文解説: A-MEM — Zettelkasten方式によるLLMエージェントの自律的メモリ管理 23/02/2026
- ICML 2025論文解説: RepoAudit — 自律型LLMエージェントによるリポジトリレベルコード監査 22/02/2026
- NeurIPS 2023論文解説: Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena 22/02/2026
- ICLR 2025 Spotlight論文解説: TheAgentCompany — 実世界タスクでのLLMエージェントベンチマーク 22/02/2026
- CVPR 2024論文解説: MMMU — 大規模マルチモーダル理解・推論ベンチマーク 22/02/2026
- ICLR 2025論文解説: JudgeBench --- LLM-as-Judgeの評価ベンチマーク 22/02/2026
- NeurIPS 2024論文解説: RankRAG — コンテキストランキングとRAGを単一LLMで統合する 21/02/2026
- EMNLP 2024論文解説: CodeAgent — マルチエージェントLLMによる自律的コードレビューシステム 21/02/2026
- SIGIR 2009論文解説: Reciprocal Rank Fusion — ハイブリッド検索の基盤となったランク統合手法の原論文 20/02/2026
- EMNLP 2023論文解説: Query Rewriting for Retrieval-Augmented Large Language Models 20/02/2026
- NeurIPS 2024論文解説: Found in the Middle — Ms-PoEでLost in the Middle問題を解決する 20/02/2026
- ACL 2025論文解説: MAIN-RAG — マルチエージェント協調フィルタリングでRAGの検索ノイズを解消する 19/02/2026
- ICLR 2024論文解説: Hybrid LLM — クエリ難易度予測によるコスト効率的なLLMルーティング 19/02/2026
- ICASSP 2024論文解説: Matcha-TTS — Conditional Flow Matchingによる高速音声合成 19/02/2026
- NeurIPS 2025 Best Paper解説: Gated Attention — Sigmoidゲートが実現する非線形・スパース・Attention-Sink-Freeなアテンション 18/02/2026
- 論文解説: The Complexity Trap — Observation MaskingはLLM要約と同等以上のコンテキスト管理効率を実現する 18/02/2026
- NAACL 2025論文解説: MMAU — 5ドメイン×5能力でLLMエージェントを網羅的に評価するベンチマーク 17/02/2026
- COLING 2025論文解説: Benchmark Self-Evolving — マルチエージェントによる動的LLM評価フレームワーク 17/02/2026
- NeurIPS 2024論文解説: LLM-Check — LLMのHallucination検出手法の体系的評価 17/02/2026
- NeurIPS 2025論文解説: Multi-Agent Collaboration via Evolving Orchestration — 強化学習で進化する操り人形師パラダイム 17/02/2026
- カンファレンス論文解説: AvaTaR - LLMエージェントのツール使用最適化 15/02/2026
- EMNLP 2024論文解説: MiniCheck - 高速・高精度なLLMファクトチェック 14/02/2026
- NeurIPS 2024論文解説: HaloScope - 未ラベルLLM生成データを活用したハルシネーション検出 14/02/2026