Home
0h-n0 TechBLog
キャンセル

📄 NeurIPS 2024論文解説: Compact Language Models via Pruning and Knowledge Distillation (Minitron)

本記事は Compact Language Models via Pruning and Knowledge Distillation (arXiv:2407.14679)(NeurIPS 2024採択)の解説記事です。 論文概要(Abstract) 著者らは、大規模LLMをプルーニング(枝刈り)した後に知識蒸留で再学習することで、スクラッチ学習の3%未満のデータ量で同等性能のコンパクト...

📄 COLING 2025論文解説: MAC-SQL — Selector・Decomposer・Refinerによるマルチエージェント協調Text-to-SQL

本記事は MAC-SQL: A Multi-Agent Collaborative Framework for Text-to-SQL(COLING 2025採択)の解説記事です。 論文概要(Abstract) MAC-SQLは、大規模データベースと複雑なクエリに対応するため、3つの専門エージェント(Selector、Decomposer、Refiner)が協調してText-to-SQL...

✍️ Google Developers Blog解説: Gemini 2.5の動画理解 — ネイティブマルチモーダルによる映像×音声×コード統合処理

本記事は Advancing the frontier of video understanding with Gemini 2.5(Google Developers Blog、2025年5月9日) の解説記事です。 ブログ概要(Summary) Google Developers Blog が2025年5月に公開した本記事は、Gemini 2.5 の動画理解能力に焦点を当てた技術解説...

✍️ AWS解説: Amazon Bedrock×RAGによるエンタープライズText-to-SQLの構築パターン

本記事は AWS Machine Learning Blog の解説記事です。 ブログ概要(Summary) AWSは、RAGベースのドキュメントアシスタントにおいて、ベクトル検索だけでは構造化データの正確な問合せが困難であるという課題に対し、エンティティ抽出+SQLクエリ+エージェントを統合したアーキテクチャを提案している。Amazon Bedrock上のClaude 3.5 Sonn...

📄 論文解説: LLM4FaaS — LLMとFunction-as-a-Serviceで実現するノーコードアプリケーション開発

論文概要(Abstract) 本論文は、LLMが生成したコードをFunction-as-a-Service(FaaS)プラットフォーム上で自動的にデプロイ・実行するフレームワーク「LLM4FaaS」を提案している。著者らによると、LLMは自然言語からのコード生成能力に優れるものの、生成コードの実行環境の構築・デプロイは依然として技術的障壁が高い。FaaSの高い抽象度を活用することで、この障...