- 📄 論文解説: Let's Verify Step by Step — プロセス監督による数学的推論の改善
- ✍️ Scale AI: SWE-Bench Pro — Raising the Bar for Agentic Coding
- 📄 論文解説: Measuring Leakage in LLM-based Code Generation Benchmarks
- 📄 論文解説: SWE-agent — Agent-Computer Interfaces Enable Automated Software Engineering
- ✍️ OpenAI: Why we no longer evaluate SWE-bench Verified — データ汚染と飽和の監査報告
本記事は Preferred Networks Tech Blog: テキスト埋め込みモデルPLaMo-Embedding-1Bの開発 および Hugging Face Model Card: pfnet/plamo-embedding-1b の解説記事です。 ブログ概要(Summary) Preferred Networks(PFN)は、日本語テキスト埋め込みモデルPLaMo-Embe...