/ HomePage / Computer / Software / Linux-Konfiguration / distcc

Verteiltes Builden mit distcc

Gentoo auf alter Hardware zu installieren, ist ein langwieriges Unterfangen, da alle Pakete erst kompiliert werden m�ssen. Aber es gibt Abhilfe! Falls ein oder mehrere aktuelle Rechenknechte im Netz verf�gbar sind, kann man deren Rechenpower zum kompilieren nutzen wobei sie noch nicht mal zwingend unter Gentoo-Linux laufen m�ssen - es funktioniert mit anderen Distridutionen genau so.

Das Zauberwort hei�t distcc

Hier steht geschrieben was alles eingestellt werden sollte, um distcc unter Gentoo zum Laufen zu bringen. Danach sollte ein emerge die wahre Freude sein, zumindest um Welten schneller als vorher. Doch Vorsicht: Der Pr�prozess wird immer nur auf der aktuellen Maschine gestartet! Falls diese also die Bremse ist, hilft auch distcc nicht viel. Desweiteren sind die Compilerprozesse nicht gerade klein, ben�tigen also eine Menge Speicher.

1. Installation

emerge distcc

[$[Get Code]]

2. Initialisierung

in der /etc/make.conf FEATURES hinzuf�gen:

FEATURES="distcc"
MAKEOPTS="-j2"

[$[Get Code]]

MAKEOPTS gibt an wieviele Compile-Prozesse gleichzeitig im ganzen distcc-Verbund gestartet werden sollen. Die Gentoo-Doku nennt als Richtiline "Anzahl der Prozessoren +1" pro Maschine. Bei vielen Hosts entsprechend hoch, da hier alle Prozesse aller Maschinen zusammengez�hlt werden. Wo dabei die Speichergrenze pro Maschine liegt - d.h. wieviele Parallelprozesse zur geringsten Compilezeit f�hren (also ob die Gentoo-dokumentation recht hat), ist noch nicht klar. Siehe Tests.

in /etc/profile path zu distcc hinzuf�gen:

PATH="/usr/bin/distcc/bin:..."

[$[Get Code]]

distcc deamon starten:

/etc/init.d/distccd start

[$[Get Code]]

so wird der distcc deamon immer beim boot gestartet:

rc-update add distccd default

[$[Get Code]]

Rechner (hosts) setzen:

distcc-config --set-hosts DISTCC_HOSTS
distcc-config --set-hosts localhost/1 lemur/2,lzo

[$[Get Code]]

Das bedeutet dass localhost nur einen Prozess zur Zeit starten soll (/1), lemur soll 2 Prozesse bekommen (/2) und die Kommunikation �bers Netz l�uft komprimiert (lzo) was schneller sein soll. Ob es wirklich schneller ist muss getestet werden. Wenn der Rechner langsam, das Netz aber schnell ist, k�nnte die komprimierte Kommunikation sogar langsamer als die unkomprimierte sein, weil die Komprimierung zu viel Zeit ben�tigt.

MAKEOPTS sollte in unserem Fall also mindestens ein -j3 enthalten, so dass drei Build-Prozesse gestartet werden. localhost sollte immer gesetzt sein, da sonst auf dem lokalen Rechner nicht mehr compiliert werden kann, falls die anderen nicht mehr im Netz verf�gbar sind.

Ein

top -u distcc

[$[Get Code]]

auf den entsprechenden Maschinen zeigt, ob wirklich etwas passiert.

3. Troubleshooting

3.1 Makeopts in `/etc/make.config`

MAKEOPTS="-j2" darf nicht CC=distcc enthalten, das geht's schief und endet in seltsamen Fehlermeldungen. Weterhin darf distcc nicht in den cflags stehen, wirklich nur in FEATURES. distcc sollte nur �ber $PATH zu finden sein.

3.2 Verschiedene GCC-Versionen und Prozessoren

Manchmal es zu Problemen kommen wenn verschiedene GCC-Versionen oder Prozessoren auf den Rechnern im distcc-Verbund verwendet werden. In solchen F�llen hilft es in der make.conf folgende Zeilen hinzuzuf�gen:

CC="gcc"
CXX="g++"

[$[Get Code]]

dann klappt es auch wieder. Quelle: Gentoo-Forum

4. Tests

Lars hat z.Z. vier Rechner - mal sehen was die so wegrechnen. P133, P200, K6-III-450, PIII-500 dann wollen wir mal sehen, wo bei distcc schlu� ist.

Lars:
Ich habe mein aktuelles Projekt genommen, es enth�lt ca. 470kb C++ source code �ber mehrere Dateien verteilt. Voraussetzung zum Builden ist libsdl, sdl-gfx, sdl-sound, sdl-mixer und was davon abh�ngt.

Verwendet habe ich 4 Rechner

Proz. Typ	Name	MHz	RAM
Pentium	moon	133	80MB
Pentium	phobos	200	80MB
AMD K6-III	lemur	450	128MB
Pentium III	sputnik	500	192MB

Gebaut wird immer mit time make, evtl. ein -jX angeh�ngt. Ausgegeben wird dann immer
real 1m5.0
user 0m59.0
sys 0m3.0

Was folgendes besagt: der gesamte Build-Prozess lief 1:05 Minuten, im Usermode wurden 59 Sek. verbraten, sys soll hier nicht weiter interessieren.

Lets start.

Die Tabellen sind vielleicht etwas komisch zu lesen, aber ich habe auf dem Rechner immer die /etc/distcc/hosts manipuliert. Ist der Host also moon/1 steht in /etc/distcc/hosts nur ein moon/1. Darunter sind die Zeiten angegeben, wie lange der Kompiliervorgang gedauert hat.

4.1 Test auf `lemur` alleine

host	moon/1	phobos/1	sputnik/1	localhost/1
real	6:10	4:57	1:06	0:57
user	0:08	0:08	0:08	0:52

Zu den Zeiten: localhost heisst, das Programm wurde nur auf lemur kompiliert, es hat 57sek gedauert. Bei den anderen Rechnern entsprechend. Es wurde also immer nur ein Rechner zum Compilieren verwendet, wobei lemur der Rechner war von dem das Ganze initiiert wurde.
Interessant ist, dass 'user' (wird nur auf entfernten Rechnern gebaut) immer 8sek. betr�gt. Das ist der Overhead, also die Zeit die Pr�prozessor und Linker brauchen, um die Sourcen zusammenzustellen und die fertigen Objekte zu erstellen.

4.2 mehrere Rechner gleichzeitig

time make -j2

host	moon/1 phobos/1	sputnik/1 localhost/1
real	2:51	0:34
user	0:08	0:31

Hier ist zu sehen, dass auch zwei langsame Rechner durchaus n�tylich sein k�nnen k�nnen. Zusammen brauchen phobos und moon ca. 3min zum Builden, fast doppelt so schnell als einer der beiden allein.
Ok, die beiden schnelleren Rechner brauchen zusammen nur 34sek.

4.3 Test auf `sputnik`

spare ich mir hier, Ergebnisse sind nicht viel anders.

4.4 Test auf `phobos`

host	moon/1	localhost/1	sputnik/1	lemur/1
real		5:20	1:33	1:28
user		5:11	0:33	0:33

Hier sieht man, dass der Overhead 33sek betr�gt, die �ltere Hardware fordert ihren Tribut. (SCSI 4GB IBM DCAS, aber 100MBit Netz)

time make -j2

host	sputnik/2	lemur/2
real	1:13	1:10
user	0:33	0:33

Hier kann man sch�n sehen, das die Latenz durch gleichzeitiges Builden etwas gemildert werden kann. Normal wird ja ein Source durch den Pr�prozessor getrieben, an den anderen Rechner �bertragen, dort gebuildet, assembliert und zur�ck geschickt.

Setzt man jetzt ein /2 ein (der Rechner nimmt 2 Prozesse gleichzeitig entgegen) ist der entfernte Rechner besser ausgelastet, da er nicht auf den langsameren warten mu�. Also ist /2 (mindestens) fuer entfernte Rechner eigentlich Pflicht.

time make -j2

host	sputnik/1 lemur/1
real	0:56
user	0:33

Ist etwas besser, es sind halt 2 Rechner. Aber trotzdem wird jeder etwas warten m�ssen, also /2 setzen und entsprechend mehr Prozesse starten.

time make -j4

host	sputnik/2 lemur/2
real	0:50
user	0:33

Nicht mehr so viel schneller. Die alte Hardware ist einfach zu langsam. Nichtsdestotrotz ist es nicht schlecht, mit zwei schnellen Rechnern im Netz das Builden um den Faktor 6 zu beschleunigen. Doch Vorsicht, das kann nach hinten losgehen, denn wenn noch ein langsamer Rechner dazukommt kann der Ergebnis schnell zusammenbrechen, da zu lange auf die Kr�cke gewartet werden muss.

time make -j5

host	localhost/1 sputnik/2 lemur/2
real	1:08
user	1:02

Beim n�chsten Ergebnis ist nur die Reihenfolge in /etc/distcc/hosts vertauscht. Das sagt uns, dass die langsamen Rechner immer nach hinten sollten, Damit sie immer zum Schluss mit Aufgaben beliefert werden. Doch auch das kann nach hinten losgehen, also besser extrem langsame Rechner ganz weglassen.

time make -j5

host	sputnik/2 lemur/2 localhost/1
real	0:56
user	0:44

Es ist also durchaus Potenzial in distcc.

Doch auch distcc kann nicht zaubern, so ist der Gewinn beim Kompilieren zwar sehr hoch, aber der Overhead z.B. bei emerge doch um einiges h�her, denn da wird zuerst entpackt (was auf langsamen Maschinen sehr lange dauern kann) dann wird mittels configure die Umgebung gepr�ft (was auch sehr lange dauert) dann wird kompiliert (was jetzt allerdings viel schneller geht) erst dann wird installiert und aufger�umt. Besonders bei gro�en Paketen wie X, KDE oder Firefox wird distcc auch eine menge bringen wenn der "kleine" Rechner die Zielplattform sein soll, und dazu wird man distcc meistens verwenden.

Wenn ich mal Zeit bzw. Lust habe werde ich in phobos mal eine schnellere Platte einbauen und dann mal gucken ob der Overhead sinkt, was ich mal nicht annehme, da bei der Gr��e der Sourcen und dem compiler etc. alles brav in die Buffer passt und somit fast keine Plattenzugriffe mehr n�tig waren.

BTW: Selbst auf phobos mit seinen nur 80MB RAM wurde der Swap nicht gebraucht, um mittels -j5 die Sourcen zu bilden, somit ist die Speicherverwaltung von Linux richtig gut.

Ist einer der eingetragenen Rechner in der /usr/distcc/hosts nicht erreichbar ist das Ergebnis unterschiedlich, mal geht die Erkennung sehr fix, mal dauert es ewig. Einen richtigen Weg habe ich noch nicht gefunden. Werde aber hier noch ein wenig analysieren

 [Update zu Nikolausi]

4.5 Protzrechner (naja, heute taugt er nicht mehr dazu )

Nur mal um zu zeigen, das es auch noch schneller geht, wenn mein neues Monster im Hintergrund steht. Habe mal /usr/distcc/hosts nur auf ihn gelenkt, somit wird nur dort kompiliert. Der Hauptrechner ist dabei sputnik

time make -j2

host	monster/2
real	0:16
user	0:08

Update 2.12.2005

Mittlerweile ist Lars' Rechnerpark geupdated worden.

Verwendung finden jetzt 5 Rechner

Proz. Typ	Name	MHz	RAM	Kommentar
Pentium MMX	moon	200	96MB	nur 64MB gecached, VX Board
Pentium III	sputnik	500	192MB	Laptop
Athlon64 3k+	monster	1800	1536MB	Mein Numbercruncher, sauschnell
Athlon 2200+		1800	256MB	Wird mein neuer Server
AMD K6-III	lemurbootp	450	128MB	keine HD, Netboot only

Gerade mit dem K6-III k�nnte es interessant werden, da der Rechner keine eigene Festplatte mehr hat (Netboot) und alles �ber das Netz ziehen mu�. Mal sehen ob sowas noch eine Compile-unterst�tzung sein kann oder nur noch eine Bremse, die man besser wegl�sst.

Desweiteren bringt ccache eine ganze Menge Speedup, gerade wenn alle Sourcen erneut compiliert werden werden m�ssen. Aber dazu sp�ter mehr...

Diskussion (aufklappen)

Elsni 01.12.2005 22:36 Uhr: Lars, kannst Du mir das Source-Paket zur verf�gung stellen, damit ich die Kompilierungszeiten mal auf meinen Maschinen testen kann? W�rde mich interessieren...

Lars 2.12.2005 8:21 Uhr: Klar, nur so viel, es ist ein lebendes Projekt, also werden die Zeiten schlechter sein, da das Projekt ja schon ein ganzes St�ck gewachsen ist. Aber um derartige Tests zu machen ist es prima geeignet. Ich werde auch mal ein update geben. Wenn mein neuer Server endlich rennt, erstmal mu� er jetzt Stabilit�t beweisen.

Elsni 02.12.2005 11:00 Uhr: Wir k�nnen ja sonst auch ein anderes Programm in einer bestimmten Version nehmen, m�glichst eins was etwas umfangreicher ist und l�nger zum Kompilieren braucht, was wei� ich mc oder links oder den atari800. Letzterer w�re vielleicht ganz gut, der hat viel Code ohne dass dieser nur aus irgendwelchen Lib-Aufrufen besteht.

Lars 2.12.2005 13:50 Uhr: atari800 ist ok. Und hier noch ein paar Zahlen bzgl. atari800 von mir.

Das nicht wirklich erste mal, (caches gef�llt). Systeminfo: Pentium IV, echte *LOL* 1.8GHz Willamate FSB100?

 cat /etc/make.conf | grep ^MAKEOPTS
 MAKEOPTS="-j2"

 ccache -C
 time emerge atari800

host	localhost
real	1:09
user	0:47

Und jetzt mit ccache Nutzung

 time emerge atari800

host	localhost
real	0:45
user	0:30

Ich glaube, das atari800 nicht wirklich geeignet ist, es sollte wohl eher mit einem C++ Programm getestet werden, da C fast in Nullzeit kompiliert werden kann. Und somit immer der Netzdurchsatz die Bremse darstellen w�rde. Aber probier es selbst aus, ich werde Dir mein Projekt trotzdem mal schicken.

5. Siehe auch

6. Links:

Distcc Homepage: http://distcc.samba.org/
Gentoo Distcc Documentation
Problems getting distcc to work

Verteiltes Builden mit distcc

Allgemein

Knowledge Base

Community

Privat

Verteiltes Builden mit distcc

1. Installation

2. Initialisierung

3. Troubleshooting

3.1 Makeopts in `/etc/make.config`

3.2 Verschiedene GCC-Versionen und Prozessoren

4. Tests

4.1 Test auf `lemur` alleine

4.2 mehrere Rechner gleichzeitig

4.3 Test auf `sputnik`

4.4 Test auf `phobos`

4.5 Protzrechner (naja, heute taugt er nicht mehr dazu )

Update 2.12.2005

5. Siehe auch

6. Links:

Verteiltes Builden mit distcc

Allgemein

Knowledge Base

Community

Privat

Verteiltes Builden mit distcc

1. Installation

2. Initialisierung

3. Troubleshooting

3.1 Makeopts in /etc/make.config

3.2 Verschiedene GCC-Versionen und Prozessoren

4. Tests

4.1 Test auf lemur alleine

4.2 mehrere Rechner gleichzeitig

4.3 Test auf sputnik

4.4 Test auf phobos

4.5 Protzrechner (naja, heute taugt er nicht mehr dazu )

Update 2.12.2005

5. Siehe auch

6. Links:

3.1 Makeopts in `/etc/make.config`

4.1 Test auf `lemur` alleine

4.3 Test auf `sputnik`

4.4 Test auf `phobos`