Home
0h-n0 TechBLog
キャンセル

✍️ Zilliz解説: セマンティックハイライティングモデルでRAGトークンコストを70-80%削減

ブログ概要(Summary) 本記事はMilvus公式ブログ「Semantic Highlighting for RAG Context Pruning and Token Saving」(Zilliz、2026年1月公開)の解説記事です。RAG(Retrieval-Augmented Generation)パイプラインにおいて、検索済みドキュメントからクエリに意味的に関連する文のみを抽出...

📄 論文解説: M-RAG — チャンクフリー検索戦略でRAGの情報断片化を解消

論文概要 本記事は arXiv 2603.26667 “M-RAG: Making RAG Faster, Stronger, and More Efficient” の解説記事です。M-RAGは従来のRAG(Retrieval-Augmented Generation)パイプラインにおけるテキストチャンキングを排除し、ドキュメントから「メタマーカー」と呼ばれる構造化されたKey-Valu...

📄 ICLR 2025論文解説: MMTEB — 500+タスク・250+言語の多言語テキスト埋め込みベンチマーク

論文概要(Abstract) 本記事は MMTEB: Massive Multilingual Text Embedding Benchmark の解説記事です。 MMTEBは、テキスト埋め込みモデルの評価基盤を大幅に拡張する大規模多言語ベンチマークである。従来のMTEB(Massive Text Embedding Benchmark)が58タスク・112言語をカバーしていたのに対し、...

📄 ICLR 2025論文解説: Provence — ゼロコスト文脈枝刈りでRAGを効率化

本記事は arXiv 2501.16214(ICLR 2025採択)の解説記事です。Navier Labs Europeの Chirkova らが提案した Provence (Pruning and Reranking Of retrieVEd relevaNt ContExts) は、RAG パイプラインにおける文脈枝刈り(context pruning)をバイナリ系列ラベリングとして定式...

✍️ AWS解説: ヘルスケア領域におけるHuman-in-the-Loopエージェントワークフローの4実装パターン

ブログ概要 AWSのSenior AI/ML Solutions ArchitectであるPierre de Malliard氏が2026年4月8日に公開した本ブログでは、ヘルスケア・ライフサイエンス領域のAIエージェントシステムにおいて、人間の承認を組み込む4つの実装パターンが解説されている。GxP規制、患者安全、PHI(Protected Health Information)保護、監...

📄 論文解説: Agent Workflow Memory — 再利用可能ワークフロー誘導によるLLMエージェントの長期タスク解決

論文概要 Agent Workflow Memory (AWM) は、LLMベースのエージェントが過去の経験から再利用可能なタスクワークフロー(ルーティン)を誘導し、後続タスクの解決を導く手法である。著者らは、人間が日常的に行う「過去の経験から手順を学び、将来の行動に活かす」というプロセスをエージェントに実装した。AWMはオフライン(事前の訓練データから学習)とオンライン(テスト時にストリ...

✍️ AWS解説: LangGraph×Amazon DynamoDBによる耐久性AIエージェントの構築

ブログ概要(Summary) AWS公式データベースブログにて、Lee Hannigan氏(Sr. DynamoDB Database Engineer)が2026年1月13日に公開した記事である。LangGraphのチェックポイント機構をAmazon DynamoDBで永続化するための公式パッケージ langgraph-checkpoint-aws の設計思想と実装パターンを解説している...

📄 論文解説: ALAS — ステートフルマルチLLMエージェントフレームワークによる障害認識型プランニング

論文概要(Abstract) ALASは、LLMベースのエージェントが抱える4つの根本的欠陥――自己検証の不在、コンテキスト侵食、次トークン近視、永続状態の欠如――に体系的に対処するマルチエージェントフレームワークである。各プランをロール特化エージェントに分解し、バージョン管理された実行ログによる自動状態追跡を装備し、軽量プロトコルで調整する。障害発生時にはグローバル再計画を回避し、局所補...