本記事は arXiv:2502.09992 “Large Language Diffusion Models” の解説記事です。 論文概要(Abstract) LLaDA(Large Language Diffusion with mAsking)は、マスク拡散フレームワークに基づく大規模言語モデルである。著者らは、前方過程でテキストトークンをランダムにマスクし、逆過程でTransfor...
本記事は DeepSeek-V3 Technical Report (arXiv:2412.19437) の解説記事です。 論文概要(Abstract) DeepSeek-V3は、DeepSeek-AIが2024年12月に公開したMixture-of-Experts(MoE)言語モデルである。総パラメータ数671B、トークンあたりのアクティブパラメータ数37Bという構成で、オープンソース...
本記事は arXiv:2402.16829 GISTEmbed の解説記事です。 論文概要(Abstract) GISTEmbedは、テキスト埋め込みのコントラスト学習において、ガイドモデルを用いてバッチ内ネガティブサンプルから偽ネガティブ(false negative)を除去する手法である。著者らは、既存の学習済み埋め込みモデルをガイドとして再利用し、追加のハードネガティブマイニングな...
本記事は AWS Bedrock AgentCore SRE Agent の技術解説記事です。 ブログ概要(Summary) Amazon Bedrock AgentCoreのSREエージェントは、AWSが公開するオープンソースのリファレンス実装であり、LangGraphフレームワークを用いたSupervisor+4専門エージェント(Kubernetes Agent、Metrics Ag...
本記事は Microsoft Research AIOpsLab の技術解説記事です。 ブログ概要(Summary) AIOpsLabは、Microsoft Researchが開発したAIOps(Artificial Intelligence for IT Operations)手法の標準化されたベンチマーク評価フレームワークである。クラウドインシデント対応を自動化するAIエージェントを...
本記事は arXiv:2410.17033 “ARES: Automated Root-cause Extraction and Synthesis for Cloud Incidents” の解説記事です。 論文概要(Abstract) ARESは、IBM Researchが提案するエージェント型クラウドインシデント自動対応システムである。SRE Manager Agent、Monit...
本記事は arXiv:2411.04536 “A Multi-Agent Approach for Self-Healing in Cloud Computing Environments” の解説記事です。 論文概要(Abstract) 本論文は、クラウドコンピューティング環境における自己修復(Self-Healing)を実現する4層階層型マルチエージェントシステム(MAS)を提案して...
本記事は arXiv:2503.00455 “SRE-Agent: A Multi-Agent Framework for Automating Site Reliability Engineering Tasks” の解説記事です。 論文概要(Abstract) SRE-Agentは、大規模言語モデル(LLM)を活用してSite Reliability Engineering(SRE)...
本記事は Google Research Blog “SOAR: New algorithms for even faster vector search with ScaNN”(2024年4月10日公開)の解説記事です。対応する論文は arXiv:2404.00774 “SOAR: Improved Indexing for Approximate Nearest Neighbor Sea...
本記事は NVIDIA Technical Blog “Accelerating Vector Search: NVIDIA cuVS IVF-PQ Part 1, Deep Dive” の解説記事です。 ブログ概要(Summary) NVIDIAのcuVS(CUDA Vector Search)ライブラリにおけるIVF-PQ(Inverted File Index with Produ...