it:server:monitoring:netdata

Netdata

apt install netdata
systemctl start netdata
systemctl enable netdata
systemctl status netdata

Služba běží na localhostu na portu 19999.

Konfigurační soubor služby je /etc/netdata/netdata.conf. V tuto chvíli si vystačím pro přístup s SSH tunelem, ale pokud bych chtěl povolit přístup z vnitřní sítě, tak bych musel nastavit na jaké IP adrese má služba naslouchat a pak samozřejmě povolit na firewallu a službu restartovat.

#bind socket to IP = MY_SERVER_IP_ADDRESS
bind socket to IP = 127.0.0.1

A tady už výsledek.

zdroje:

Netdata v přednastavené podobě generuje alarmy a notifikace, když je něco špatně. Některé notifikace mohou být nežádoucí nebo mít příliš nízkou hranici spouštění. V článku je popsáno, jak editovat libovolné notifikace. Případně další zdroj.

cd /etc/netdata
sudo ./edit-config health.d/net.conf
systemctl restart netdata

Netdata monitoruje zaplněnost disku u některých složek duplicitně. Záleží moc na rozdělení disku konkrétního serveru. Když jsem chtěl vypnout monitoring některých oddílů, postupoval jsem takto. Do souboru /etc/netdata/netdata.conf přidat tyto řádky:

[plugin:proc:diskspace]                                   
        exclude space metrics on paths = /dev* /run* /var*

Přicházelo mi příliš mnoho warning hlášení do e-mailu o problému se sběrem dat PHP-FPM. Je to patrně proto, že v některých chvílí je server přetížen a Netdata nestíhá sbírat informace. Řeší to patrně tak, že zpožděná data uvádí jako aktuální. Samozřejmě je to nežádoucí záležitost.

Informace o tomto jevu lze hledat v log souboru netdata */var/netdata/error.log*. Lze buď posílit server nebo pokud je problém akceptovatelný, tak posunout úroveň prahu spuštění hlášení. Úroveň prahu lze posunout takto:

./edit-config health.d/phpfpm.conf

Nalezl jsem při editaci tyto řádky:

warn: $this > (($status >= $WARNING)  ? ($update_every) : ( 5 * $update_every))
crit: $this > (($status == $CRITICAL) ? ($update_every) : (60 * $update_every))

Aktuální nastavení říká, že pokud dojde ke zpoždění delším jak 5 sec, tak dojde k vygenerování warningu. Takže by mělo stačit hodnotu posunout třeba na 10 sec.

Po změně restartovat Netdata.

systemctl restart netdata
  • it/server/monitoring/netdata.txt
  • Poslední úprava: 2023/02/18 15:31
  • autor: Petr Nosek