本記事は Production-grade API Gateway patterns for Microsoft Foundry(Microsoft Community Hub、2026年2月公開)の解説記事です。 ブログ概要(Summary) Microsoftの「Startups at Microsoft」チームが公開したこのブログ記事は、Azure OpenAI(Microsoft...
23/02/2026 blog tech_blog
Azure OpenAI API Management +3
ブログ概要(Summary) LangChain共同創業者のHarrison Chase氏が2024年10月に公開したブログ記事「Memory for Agents」は、エージェントにおけるメモリの役割をProcedural Memory(手続き記憶)、Semantic Memory(意味記憶)、Episodic Memory(エピソード記憶)の3類型に整理し、それぞれの実装戦略を解説した...
23/02/2026 blog tech_blog
LangChain LangGraph agent-memory +3
ブログ概要(Summary) AWS Database Blogが2026年1月に公開した「Build Durable AI Agents with LangGraph and Amazon DynamoDB」は、LangGraphのチェックポイント機構をAmazon DynamoDBで永続化するDynamoDBSaverライブラリの設計と実装を解説したものである。小さなチェックポイント(...
23/02/2026 blog tech_blog
AWS DynamoDB LangGraph +4
ブログ概要(Summary) Anthropicのエンジニア Justin Young氏が2025年11月に公開したブログ記事「Effective Harnesses for Long-Running Agents」は、AIエージェントが複数のコンテキストウィンドウにまたがって長時間動作する際の状態管理・永続化パターンを解説したものである。Initializer Agent(初期セットアッ...
23/02/2026 blog tech_blog
Anthropic Claude agent-harness +3
本記事は Anthropic: Introducing Citations on the Anthropic API および Claude API: Citations ドキュメント の解説記事です。 この記事は Zenn記事: LangGraph×Claude Sonnet 4.6のtool_useで出典付きAgentic RAGを構築する の深掘りです。 ブログ概要(Summary)...
23/02/2026 blog tech_blog
Claude RAG citations +4
本記事は Don’t Break the Cache: An Evaluation of Prompt Caching for Long-Horizon Agentic Tasks の解説記事です。 論文概要(Abstract) LLMのエージェント応用が拡大するなか、マルチターン推論で発生する高コスト・高レイテンシの課題に対し、プロンプトキャッシュ(KVキャッシュの再利用)が有効な最適...
23/02/2026 blog paper
prompt-caching kv-cache llm-agent +4
論文概要(Abstract) 本論文は、AIとの対話を通じてコードを生成する新しいプログラミング実践「Vibe coding」を、8時間以上の動画データの質的分析によって実証的に明らかにした研究である。著者らは、Vibe codingが「AIプロンプト → コード評価 → 手動編集」の反復サイクルに従うことを発見し、この実践がプログラミング専門知識を不要にするのではなく、コンテキスト管理・...
23/02/2026 blog paper
vibe-coding LLM end-user-programming +2
本記事は arXiv:2501.09136 “Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG” の解説記事です。 論文概要(Abstract) 大規模言語モデル(LLM)は静的な訓練データに依存するため、動的なリアルタイムクエリへの対応に限界がある。従来のRetrieval-Augmented Generat...
23/02/2026 blog paper
RAG agentic-ai LLM +3
論文概要(Abstract) Ruriは、国立情報学研究所(NII)のTsukagoshiらによって提案された日本語汎用テキスト埋め込みモデルである。英語圏で発展した大規模埋め込みモデルの手法を日本語に適用し、弱教師あり事前学習・LLM合成データによる中間学習・教師あり微調整の3段階パイプラインで学習する。著者らは同時に日本語埋め込み評価基盤JMTEB(Japanese Massive T...
23/02/2026 blog paper
embedding JMTEB contrastive-learning +3
本記事は RouteLLM: Learning to Route LLMs with Preference Data (arXiv:2406.18665) の解説記事です。 論文概要(Abstract) 大規模言語モデル(LLM)は多様なタスクで高い性能を示すが、高性能モデルほど推論コストが高く、すべてのリクエストに高性能モデルを使うのは非効率である。著者らは、人間の選好データを活用して...
23/02/2026 blog paper
LLM routing cost-optimization +4