Ollama

💻 IT・テクノロジー — 全 2 件

AI・機械学習 2026年5月6日 12:04

ローカルLLM本番投入でハマった話｜量子化・マルチGPU・コスト削減の実録2026

月300万超のAPI費用とセキュリティ問題が重なり、ローカルLLM本番移行を決断。vLLM・llama.cppで実際に踏んだ量子化の落とし穴やマルチGPU構成のトラブルを赤裸々に共有します。

AI・機械学習 2026年4月13日 18:02

ローカルLLM構築完全ガイド2026｜Ollama・llama.cpp本番運用の実践戦略

Ollama 0.6系・llama.cpp最新版でローカルLLMを本番構築する手順を徹底解説。GPU選定・RAG統合・API化まで網羅。今すぐ構築を始めよう。