ブログ概要(Summary) 本記事は Anthropic Engineering Blog: “Building a C compiler with a team of parallel Claudes”(2026年2月5日公開)の解説記事です。 Anthropicの研究者Nicholas Carliniは、16並列のClaude Opus 4.6エージェントを使い、Linuxカーネル...
本記事は arXiv:2601.10825 “Reasoning Models Generate Societies of Thought”(Wu, Kotek, Potts, Goodman, 2025年1月)の解説記事です。 論文概要(Abstract) 著者らは、RLHF(人間のフィードバックによる強化学習)やGRPO(報酬ベース強化学習)で訓練された大規模言語モデル(LLM)の推...
本記事は AgentTool: Evaluating Tool Selection in Multi-Agent Workflows の解説記事です。 論文概要(Abstract) AgentToolは、LLMベースのエージェントがマルチエージェントワークフローにおいてツールを正しく選択できるかどうかを評価するためのベンチマークである。Coding、Math、Reasoning、Writ...
本記事は A Reinforcement Learning Environment for Automatic Code Optimization in the MLIR Compiler (arXiv:2409.11068) の解説記事です。 論文概要(Abstract) 著者らはMLIR RLと名付けた強化学習環境を提案しています。この環境はMLIRコンパイラのLinalg Dial...
本記事は RouteLLM: Learning to Route LLMs with Preference Data(Ong et al., ICLR 2025)の解説記事です。 論文概要(Abstract) RouteLLMは、推論時にクエリごとに強いLLM(例: GPT-4)と弱いLLM(例: Mixtral-8x7B)を動的に切り替えるルーターモデルのフレームワークである。著者らは...
本記事は Hardware Acceleration of LLMs: A comprehensive survey and comparison の解説記事です。 論文概要(Abstract) 本サーベイは、LLM推論のハードウェア高速化に関する包括的な調査と比較を提供する。著者らはGPU、FPGA、ASIC、In-Memory Processing(PIM)の4つのハードウェアプラッ...
本記事は arXiv:2408.08435 “Automated Design of Agentic Systems”(Hu et al., 2024)の解説記事です。 論文概要(Abstract) Hu, Lu, Clune(University of British Columbia, 2024年8月)は、エージェントシステムの設計そのものを自動化する新しい研究問題「ADAS(Aut...
本記事は AWS and Cerebras Collaboration Aims to Set a New Standard for AI Inference Speed and Performance in the Cloud の解説記事です。 ブログ概要(Summary) 2026年3月13日、AWSとCerebrasは、クラウドにおけるAI推論の速度とパフォーマンスの新たな標準を目...
本記事は AIDE: Machine Learning Engineer Agent (Weco AI, 2025)の解説記事です。 論文概要(Abstract) Weco AIのAIDE(AI Development Environment)は、MLエンジニアリングタスクをコード空間におけるツリー探索問題としてフレーミングし、LLMエージェントが反復的にソリューションコードを生成・改善...
本記事は Inside NVIDIA Groq 3 LPX: The Low-Latency Inference Accelerator for the NVIDIA Vera Rubin Platform の解説記事です。 ブログ概要(Summary) NVIDIA Groq 3 LPUは、NVIDIAが2025年12月にGroq社の推論技術IPを$20Bで取得して開発した、SRAM中...