本記事は arXiv:2410.03038 “SemanticCacheQA” の解説記事です。 この記事は Zenn記事: Semantic Kernel v1.41フィルターで実現する本番AIアプリの品質管理基盤 の深掘りです。Zenn記事ではPromptRenderFilterを用いたセマンティックキャッシングの実装パターン(SHA-256ハッシュによる完全一致キャッシュ)を紹介して...
本記事は arXiv:2503.14764 “Quantifying PII Leakage in LLMs: A Comprehensive Framework” の解説記事です。 この記事は Zenn記事: Semantic Kernel v1.41フィルターで実現する本番AIアプリの品質管理基盤 の深掘りです。Zenn記事ではPromptRenderFilterを用いた正規表現ベース...
ブログ概要(Summary) MicrosoftのSemantic Kernelチーム(Roger Barreto、Eduard van Valkenburg、Dmytro Struk)が2024年11月に公開したブログ記事では、Semantic Kernelのフィルター機構がGA(General Availability)リリースされたことが報告されている。従来のイベントベースAPIから...
ブログ概要(Summary) OpenTelemetryのGenAI SIG(Special Interest Group)が2025年3月に公開したブログ記事では、AIエージェントの可観測性を標準化するためのセマンティック規約策定の進捗と、フレームワーク計装の2つのアプローチが解説されている。著者らは、LLM・ベクトルDB・AIエージェントの3層にわたる統一的なテレメトリ収集の枠組みを提...
本記事は arXiv:2412.12667 “Defeating Prompt Injections by Design” の解説記事です。 この記事は Zenn記事: Semantic Kernel v1.41フィルターで実現する本番AIアプリの品質管理基盤 の深掘りです。Zenn記事ではSemantic KernelのPromptRenderFilterを用いたプロンプトインジェクショ...
本記事は DeepSeek-V3 Technical Report (arXiv:2412.19437) の解説記事です。 論文概要(Abstract) DeepSeek-V3は671Bの総パラメータ数に対し37Bのみを活性化するMoE型言語モデルである。著者らは、DeepSeek-V2で提案されたMLAとDeepSeekMoEを継承しつつ、FP8混合精度学習、Multi-Token P...
本記事は Be Your Own Teacher: Improve the Performance of Convolutional Neural Networks via Self Distillation(Zhang et al., ICCV 2019)の解説記事です。 論文概要(Abstract) 本論文は、Self-Distillation(自己蒸留)の概念を初めて体系的に提案し...
本記事は Methods of improving LLM training stability (arXiv:2410.16682) の解説記事です。 論文概要(Abstract) 大規模言語モデルの学習において、ロスのスパイク(急増)や勾配の発散は深刻な問題である。本論文の著者らは、QK-Norm、RMSNorm、logit softcapping、embedding normali...
本記事は arXiv:2310.11511 “Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection” の解説記事です。 論文概要(Abstract) Retrieval-Augmented Generation(RAG)は外部知識を利用して事実性を向上させるが、従来のRAGは入力に関係...
本記事は arXiv:2307.08691 “FlashAttention-2: Faster Attention with Better Parallelism and Work Partitioning” の解説記事です。 論文概要(Abstract) Tri Dao(Princeton/Together AI)は、FlashAttention v1のGPU利用率を25-40%から5...