CachyOSでllama.cppをコンパイルして動かす

2026年5月10日

MTPやD-Flashなどの新しい最適化をいち早く試すために、なるべく簡単にllama.cppをソースからビルドして動かせるようにします。

なぜCachyOSか

CachyOSはArch Linuxベースのディストリビューションで、ゲーミング対応を積極的に行っていることで有名です。

CachyOS — Blazingly Fast OS based on Arch Linux cachyos.org

🚀 CachyOS is a performance-optimized Arch Linux distribution with CPU-specific package builds, advanced kernel scheduling, and an effortless installation — delivering measurable speed gains without sacrificing simplicity.

nVidiaの最新ドライバが最初から含まれているので、LLM向け環境を構築する際にドライバインストールの手間を省くことが出来ます。

ビルド手順

ライブラリのインストール

cuda-toolkitとcmakeは入っていないので追加します。

CachyOSには標準でgcc16が入っていますが、これはcuda-toolkitが対応していないので別にgcc14を入れます。

1
sudo pacman -S cuda cmake gcc14

パスをエクスポート

~/.config/fish/config.fish に下記の2行を追加し source します。

1
set -gx PATH $PATH /opt/cuda/bin
2
set -gx LD_LIBRARY_PATH $LD_LIBRARY_PATH /opt/cuda/lib64

llama.cppのリポジトリをクローン

1
git clone https://github.com/ggml-org/llama.cpp.git
2
cd llama.cpp

ビルド

ここで標準のgcc16ではなくgcc14をつかいます。

1
env CUDACXX=/opt/cuda/bin/nvcc cmake -B build -DGGML_CUDA=ON -DCMAKE_CUDA_HOST_COMPILER=/usr/bin/gcc-14
2
cmake --build build --config Release -j 8

起動

1
./build/bin/llama-server --version

おまけ

LACTを入れるとGUI操作でGPUの消費電力を制限することができます。

WindowsのMSI Afterburnerのようなツールです。

1
sudo pacman -S lact

CachyOSでllama.cppをコンパイルして動かす

なぜCachyOSか

ビルド手順

おまけ

関連記事

生成速度2倍は本当か？Qwen3.6のMTPを試す

macからCachyOSにつなぐ一番簡単な方法はkrdpでした

Claude Codeでe2eテストを自動生成した話