本記事は Qwen2.5-VL Technical Report (arXiv:2501.12387) の解説記事です。 論文概要(Abstract) Qwen2.5-VL は Alibaba Cloud が2025年1月に発表したオープンソースの Vision-Language Model(VLM)である。3B / 7B / 72B の3サイズで展開され、72B モデルは MMMU ベ...
本記事は arXiv:2410.08815 “StructRAG: Boosting Knowledge Intensive Reasoning of LLMs via Inference-time Hybrid Information Structurization” の解説記事です。 論文概要(Abstract) 既存のRAG手法は知識集約的な推論タスクにおいて、必要な情報がドキュメ...
本記事は arXiv:2407.11717 “DB-GPT: Empowering Database Interactions with Private Large Language Models” の解説記事です。 この記事は Zenn記事: LangGraph×Claude Sonnet 4.6でSQL統合Agentic RAGを実装する の深掘りです。 論文概要(Abstract)...
本記事は arXiv:2404.16130 “Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity” の解説記事です。 この記事は Zenn記事: LangGraph×Claude Sonnet 4.6でSQL統合Agentic RAGを実装...
本記事は RAGO: Systematic Performance Optimization for Retrieval-Augmented Generation Serving (arXiv:2503.14649, ISCA 2025) の解説記事です。 論文概要(Abstract) RAGO(Retrieval-Augmented Generation Optimizer)は、RAG...
本記事は Compact Language Models via Pruning and Knowledge Distillation (arXiv:2407.14679)(NeurIPS 2024採択)の解説記事です。 論文概要(Abstract) 著者らは、大規模LLMをプルーニング(枝刈り)した後に知識蒸留で再学習することで、スクラッチ学習の3%未満のデータ量で同等性能のコンパクト...
本記事は MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL(COLING 2025採択)の解説記事です。 論文概要(Abstract) MAC-SQLは、大規模データベースと複雑なクエリに対応するため、3つの専門エージェント(Selector、Decomposer、Refiner)が協調してText-to-SQL...
本記事は arXiv: 2510.05691 — DecEx-RAG: Boosting Agentic Retrieval-Augmented Generation with Decision and Execution Optimization via Process Supervision の解説記事です。EMNLP 2025 Industry Trackで採択されています。 この記...
本記事は LangChain Blog: Self-Reflective RAG with LangGraph の解説記事です。 この記事は Zenn記事: LangGraph×Claude Sonnet 4.6のtool_useで出典付きAgentic RAGを構築する の深掘りです。 ブログ概要(Summary) LangChainの公式ブログでは、LangGraphのStateG...
本記事は Advancing the frontier of video understanding with Gemini 2.5(Google Developers Blog、2025年5月9日) の解説記事です。 ブログ概要(Summary) Google Developers Blog が2025年5月に公開した本記事は、Gemini 2.5 の動画理解能力に焦点を当てた技術解説...