本記事は Elastic Search Labs: Linear Retriever for Hybrid Search の解説記事です。 ブログ概要(Summary) Elasticsearchは2025年にLinear Retrieverを導入した(Elasticsearch 8.18 / 9.0以降で利用可能)。これはRRF(Reciprocal Rank Fusion)の代替とし...
ブログ概要(Summary) 本記事は Multi-instance GPU (MIG) with Dynamic Resource Allocation (DRA) on AKS の解説記事です。 Azure AKS Engineering Blogが2026年3月3日に公開したこの記事では、NVIDIA Multi-Instance GPU(MIG)とKubernetes Dynam...
本記事は arXiv:2507.09089 の解説記事です。 論文概要(Abstract) AIコーディングツールの生産性向上効果は、多くの場合、人工的なタスクや初心者プログラマーを対象とした研究で報告されてきた。本論文は、実際のオープンソースプロジェクトに貢献する経験豊富な開発者246名を対象とした無作為化比較試験(RCT)を実施し、6週間にわたって生産性への影響を測定した。結果として...
本記事は arXiv:2308.10144 ExpeL: LLM Agents Are Experiential Learners の解説記事です。 論文概要(Abstract) Zhao, Huang, Xu, Lin, Liu, Huang(2023)は、LLMエージェントがパラメータの更新なしに、経験から自律的に知識を獲得し、将来のタスクに適用する手法「ExpeL(Experien...
ブログ概要(Summary) 本記事は Democratizing AI Model Training on Kubernetes: Introducing Kubeflow Trainer V2 の解説記事です。 Kubeflow Trainer V2は、Kubernetes上でのAIモデル分散学習を簡素化する次世代フレームワークである。2025年7月にv2.0、同年11月にv2.1が...
本記事は Anthropic Engineering: Effective context engineering for AI agents の解説記事です。 ブログ概要(Summary) Anthropicのエンジニアリングブログでは、LLMベースのAIエージェントにおけるコンテキストエンジニアリングの体系的なアプローチが提唱されている。従来のプロンプトエンジニアリングが「プロンプト...
本記事は arXiv:2401.05501 の解説記事です。 論文概要(Abstract) SPLADE-v3は、Naver Labsが開発した学習型スパース検索(Learned Sparse Retrieval)モデルの第3世代である。SPLADE(SParse Lexical AnD Expansion)は、BERTのMLM(Masked Language Model)ヘッドを活用し...
本記事は arXiv:2502.12110 A-MEM: Agentic Memory for LLM Agents の解説記事です。 論文概要(Abstract) Xu, Liang, Mei, Gao, Tan, Zhang(2025)は、既存のLLMエージェントのメモリ管理が静的なストレージに依存しており、メモリ間の関係性や文脈の動的更新が不十分であるという課題に対し、Zettel...
ブログ概要(Summary) 本記事は Amazon EKS enables ultra scale AI/ML workloads with support for 100K nodes per cluster の解説記事です。 Amazon EKSが2025年7月に発表した1クラスタあたり最大100,000ノードのサポートは、従来のEKSの限界を10倍に拡張する改革である。単一クラス...
本記事は Anthropic: Contextual Retrieval の解説記事です。 ブログ概要(Summary) AnthropicのContextual Retrieval(2024年9月公開)は、RAGシステムにおけるチャンク分割時の情報損失を解決する手法である。従来のRAGでは、文書をチャンクに分割する際にチャンク単体では文脈がわからなくなる問題があった。Contextua...