Netdata
apt install netdata systemctl start netdata systemctl enable netdata systemctl status netdata
Služba běží na localhostu na portu 19999.
Konfigurační soubor služby je /etc/netdata/netdata.conf. V tuto chvíli si vystačím pro přístup s SSH tunelem, ale pokud bych chtěl povolit přístup z vnitřní sítě, tak bych musel nastavit na jaké IP adrese má služba naslouchat a pak samozřejmě povolit na firewallu a službu restartovat.
#bind socket to IP = MY_SERVER_IP_ADDRESS bind socket to IP = 127.0.0.1
A tady už výsledek.
zdroje:
Notifikace
Netdata v přednastavené podobě generuje alarmy a notifikace, když je něco špatně. Některé notifikace mohou být nežádoucí nebo mít příliš nízkou hranici spouštění. V článku je popsáno, jak editovat libovolné notifikace. Případně další zdroj.
cd /etc/netdata sudo ./edit-config health.d/net.conf systemctl restart netdata
Vypnutí monitoringu některých disků
Netdata monitoruje zaplněnost disku u některých složek duplicitně. Záleží moc na rozdělení disku konkrétního serveru. Když jsem chtěl vypnout monitoring některých oddílů, postupoval jsem takto. Do souboru /etc/netdata/netdata.conf přidat tyto řádky:
[plugin:proc:diskspace] exclude space metrics on paths = /dev* /run* /var*
Úprava notifikací php-fpm
Přicházelo mi příliš mnoho warning hlášení do e-mailu o problému se sběrem dat PHP-FPM. Je to patrně proto, že v některých chvílí je server přetížen a Netdata nestíhá sbírat informace. Řeší to patrně tak, že zpožděná data uvádí jako aktuální. Samozřejmě je to nežádoucí záležitost.
Informace o tomto jevu lze hledat v log souboru netdata */var/netdata/error.log*. Lze buď posílit server nebo pokud je problém akceptovatelný, tak posunout úroveň prahu spuštění hlášení. Úroveň prahu lze posunout takto:
./edit-config health.d/phpfpm.conf
Nalezl jsem při editaci tyto řádky:
warn: $this > (($status >= $WARNING) ? ($update_every) : ( 5 * $update_every)) crit: $this > (($status == $CRITICAL) ? ($update_every) : (60 * $update_every))
Aktuální nastavení říká, že pokud dojde ke zpoždění delším jak 5 sec, tak dojde k vygenerování warningu. Takže by mělo stačit hodnotu posunout třeba na 10 sec.
Po změně restartovat Netdata.
systemctl restart netdata