2026
- 15 / 02 Anthropic Agent Skills解説:プロダクション環境でのLLMエージェント拡張戦略
- 15 / 02 論文解説: プロンプト圧縮でトークン数40-60%削減: 文レベル符号化による高速LLM推論
- 15 / 02 論文解説: LLMサービング性能ベンチマーク: レイテンシ・スループット・コスト最適化の徹底比較
- 15 / 02 論文解説: LLM生成パラメータのコスト最適化: ベイズ最適化で20-40%削減
- 15 / 02 論文解説: Beyond ChatGPT: 50社以上の本番LLMデプロイ実態調査とコスト構造分析
- 15 / 02 論文解説: Infinite-LLM: 分散KVキャッシュで100万トークンのコンテキストを低コストで処理
- 15 / 02 Meta Code Llama解説: オープンソースで実現する最先端コード生成
- 15 / 02 論文解説: AI-Nativeソフトウェア開発ライフサイクルとV-Bounceモデル
- 15 / 02 論文解説: LLMベースのコード生成エージェント完全サーベイ
- 15 / 02 NVIDIA研究解説: エージェントAIシステムのコード実行セキュリティ
- 15 / 02 HyPA-RAG: ハイブリッド検索のパラメータ適応最適化
- 15 / 02 カンファレンス論文解説: AvaTaR - LLMエージェントのツール使用最適化
- 15 / 02 論文解説: Infini-attention - 無限長コンテキストを実現する圧縮メモリ機構
- 15 / 02 FAISS完全ガイド: 大規模ベクトル検索の実装と最適化
- 15 / 02 Anthropic研究解説: プロンプトインジェクション防御の最前線
- 15 / 02 Speculative RAG: Draftingで推論を高速化する最新手法
- 15 / 02 論文解説: SE 3.0 - AI-Nativeソフトウェア工学の新パラダイム
- 15 / 02 RAGアーキテクチャと堅牢性: 設計空間の全体像
- 15 / 02 RAG完全サーベイ: 基礎から最先端まで進化の全体像
- 15 / 02 論文解説: Large Language Models as Optimizers(OPRO)
- 15 / 02 論文解説: AgentBench - LLMエージェント評価の決定版ベンチマーク
- 15 / 02 DeepMind CodeMender解説: AI駆動型コードセキュリティ改善エージェント
- 14 / 02 AWS ML Blog解説: Amazon Bedrockの構造化出力 - スキーマ準拠AI応答の実現
- 14 / 02 論文解説: Hallucination Detection and Mitigation - LLMハルシネーションの多面的検出と緩和戦略
- 14 / 02 論文解説: STED and Consistency Scoring - LLM構造化出力の信頼性評価フレームワーク
- 14 / 02 EMNLP 2024論文解説: MiniCheck - 高速・高精度なLLMファクトチェック
- 14 / 02 NeurIPS 2024論文解説: HaloScope - 未ラベルLLM生成データを活用したハルシネーション検出
2022
- 23 / 11 Google Adsenseのads.txtをGithub pagesでホストされているjekyllのサイトへデプロイする方法
- 14 / 11 書籍『テスト駆動開発』を読みつつ、Pythonで書き直してみる。
- 11 / 11 第3章補足:書籍『SolidityとEthereumによる実践スマートコントラクト開発 ―Truffle Suiteを用いた開発の基礎からデプロイまで』
- 10 / 11 AWS CLIでよく使う基本的なコマンド(逆引き)
- 05 / 11 参考図書まとめ
- 04 / 11 DS/MLEのためのおススメYoutube Channel
- 04 / 11 DS/MLEのためのおススメサイト
- 03 / 11 機械学習系学会
- 02 / 11 2022年度11月現在:AI企業の募集要項とリンクまとめ
2020
- 07 / 05 Ubuntu20.04でgcc-9からgcc-8に変更する方法