📄 論文解説: SemanticCacheQA — LLMセマンティックキャッシュの効率と精度を評価するベンチマーク

本記事は arXiv:2410.03038 “SemanticCacheQA” の解説記事です。この記事は Zenn記事: Semantic Kernel v1.41フィルターで実現する本番AIアプリの品質管理基盤の深掘りです。Zenn記事ではPromptRenderFilterを用いたセマンティックキャッシングの実装パターン（SHA-256ハッシュによる完全一致キャッシュ）を紹介して...

30/03/2026 blog paper

semantic-cache LLM cost-optimization +2

📄 論文解説: Quantifying PII Leakage in LLMs — 三層PII分類とSILSメトリクスによるLLMプライバシーリスクの定量化

本記事は arXiv:2503.14764 “Quantifying PII Leakage in LLMs: A Comprehensive Framework” の解説記事です。この記事は Zenn記事: Semantic Kernel v1.41フィルターで実現する本番AIアプリの品質管理基盤の深掘りです。Zenn記事ではPromptRenderFilterを用いた正規表現ベース...

30/03/2026 blog paper

PII LLM-security privacy +2

✍️ Semantic Kernelフィルター GA解説: .NETとPythonの3層フィルターアーキテクチャ

ブログ概要（Summary） MicrosoftのSemantic Kernelチーム（Roger Barreto、Eduard van Valkenburg、Dmytro Struk）が2024年11月に公開したブログ記事では、Semantic Kernelのフィルター機構がGA（General Availability）リリースされたことが報告されている。従来のイベントベースAPIから...

30/03/2026 blog tech_blog

Semantic Kernel filters Python +3

✍️ OpenTelemetry GenAI SIGが提唱するAIエージェント可観測性の標準化戦略

ブログ概要（Summary） OpenTelemetryのGenAI SIG（Special Interest Group）が2025年3月に公開したブログ記事では、AIエージェントの可観測性を標準化するためのセマンティック規約策定の進捗と、フレームワーク計装の2つのアプローチが解説されている。著者らは、LLM・ベクトルDB・AIエージェントの3層にわたる統一的なテレメトリ収集の枠組みを提...

30/03/2026 blog tech_blog

OpenTelemetry AI Agent observability +2

📄 論文解説: Defeating Prompt Injections by Design — CaMeLアーキテクチャによる設計レベルのプロンプトインジェクション防御

本記事は arXiv:2412.12667 “Defeating Prompt Injections by Design” の解説記事です。この記事は Zenn記事: Semantic Kernel v1.41フィルターで実現する本番AIアプリの品質管理基盤の深掘りです。Zenn記事ではSemantic KernelのPromptRenderFilterを用いたプロンプトインジェクショ...

30/03/2026 blog paper

prompt-injection LLM-security semantic-kernel +2

📄 論文解説: DeepSeek-V3 — MLA+MoE+FP8混合精度で671Bモデルを低コスト学習する技術詳細

本記事は DeepSeek-V3 Technical Report (arXiv:2412.19437) の解説記事です。論文概要（Abstract） DeepSeek-V3は671Bの総パラメータ数に対し37Bのみを活性化するMoE型言語モデルである。著者らは、DeepSeek-V2で提案されたMLAとDeepSeekMoEを継承しつつ、FP8混合精度学習、Multi-Token P...

29/03/2026 blog paper

DeepSeek MLA MoE +6

📄 ICCV 2019論文解説: Be Your Own Teacher — CNNにおける自己蒸留の先駆的研究

本記事は Be Your Own Teacher: Improve the Performance of Convolutional Neural Networks via Self Distillation（Zhang et al., ICCV 2019）の解説記事です。論文概要（Abstract）本論文は、Self-Distillation（自己蒸留）の概念を初めて体系的に提案し...

29/03/2026 blog paper

self-distillation knowledge-distillation CNN +5

📄 論文解説: Methods of Improving LLM Training Stability — QK-NormからRMSNormまでの学習安定化技法

本記事は Methods of improving LLM training stability (arXiv:2410.16682) の解説記事です。論文概要（Abstract）大規模言語モデルの学習において、ロスのスパイク（急増）や勾配の発散は深刻な問題である。本論文の著者らは、QK-Norm、RMSNorm、logit softcapping、embedding normali...

29/03/2026 blog paper

QK-Norm RMSNorm training-stability +4

📄 論文解説: Self-RAG — 自己反省トークンによる適応的検索拡張生成

本記事は arXiv:2310.11511 “Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection” の解説記事です。論文概要（Abstract） Retrieval-Augmented Generation（RAG）は外部知識を利用して事実性を向上させるが、従来のRAGは入力に関係...

29/03/2026 blog paper

RAG retrieval LLM +3

📄 論文解説: FlashAttention-2 — GPU並列性とワーク分割の改善によるAttention高速化

本記事は arXiv:2307.08691 “FlashAttention-2: Faster Attention with Better Parallelism and Work Partitioning” の解説記事です。論文概要（Abstract） Tri Dao（Princeton/Together AI）は、FlashAttention v1のGPU利用率を25-40%から5...

29/03/2026 blog paper

FlashAttention GPU CUDA +7

1
2
3
...
81
2 / 81