Home
0h-n0 TechBLog
キャンセル

📄 論文解説: LLMパワード文書解析による高度なRAGインジェスションプロセス

論文概要 本記事は Advanced ingestion process powered by LLM parsing for RAG system (arXiv:2412.15262) の解説記事です。Retrieval Augmented Generation(RAG)システムにおいて、多様な構造を持つマルチモーダル文書の処理は依然として大きな課題である。本論文では、LLMパワードOC...

📄 論文解説: ToolACE ― 自己進化的パイプラインによるFunction Calling訓練データの大規模生成

本記事は arXiv:2409.00920 ToolACE: Winning the Points of LLM Function Calling の解説記事です。 論文概要(Abstract) ToolACEは、LLMのFunction Calling能力を向上させるための高品質な訓練データを自動生成するパイプラインである。著者らは自己進化的合成プロセスにより26,507個の多様なAP...

📄 論文解説: ARAGOG — RAGパイプラインの検索・生成分離評価フレームワーク

論文概要 本記事は ARAGOG (arXiv:2404.01037) の解説記事です。ARAGOG(Advanced RAG Output Grading)は、Retrieval-Augmented Generation(RAG)パイプラインにおける検索段階と生成段階を分離して評価する診断フレームワークである。著者らは、既存のRAG評価が end-to-end の出力品質のみに着目してお...

📄 ICLR 2025論文解説: ToolGen ― ツール検索と呼び出しを生成で統一するフレームワーク

本記事は arXiv:2410.03439 ToolGen: Unified Tool Retrieval and Calling via Generation の解説記事です。 論文概要(Abstract) ToolGenは、従来のツール検索(どのツールを使うか)とツール呼び出し(どう使うか)を分離していたパイプラインを、LLMの単一生成パスに統一するフレームワークである。各ツールに仮...

✍️ Anthropic解説: AIエージェントのための効果的なツール設計 ― 5原則と評価駆動アプローチ

本記事は Anthropicエンジニアリングブログ「Writing effective tools for AI agents」 の解説記事です。 ブログ概要(Summary) Anthropicは自社のエンジニアリングブログにおいて、AIエージェント向けツール設計の体系的なアプローチを公開した。このブログでは、ツールを「決定論的システムと非決定論的エージェントの間の新しいソフトウェア契...

📄 論文解説: Late Chunking — 長文コンテキスト埋め込みモデルによる文脈保持型チャンキング

論文概要 本記事は Late Chunking (arXiv:2409.04701) の解説記事です。Jina AIのMichael Güntherらが2024年9月に発表した本論文は、密ベクトル検索における従来のチャンキング手法が抱える文脈情報喪失の問題に対し、Transformerによるエンコード後にチャンキングを行う「Late Chunking」を提案しています。追加学習なしで既存の...