Article original : Network File System – How to Confirm Your Application is Using NFS
J'ai récemment été chargé de trouver quel processus accédait à un partage NFS. Lors de cette tâche, j'ai découvert que certains outils sont mieux adaptés que d'autres pour cette mission.
Dans cet article, je souhaite partager avec vous mes découvertes. L'ensemble du processus a été amusant et m'a donné des idées sur la façon d'utiliser ces outils pour résoudre des problèmes similaires à l'avenir.
Qu'est-ce que NFS ?
Network File System (NFS) est un protocole de système de fichiers distribué qui permet à un utilisateur d'accéder à des fichiers via un réseau informatique.
Veuillez noter que ceci n'est pas un tutoriel complet sur NFS. Pour cela, veuillez consulter le tutoriel.
Dans cet article, nous nous concentrerons uniquement sur la détection de l'accès à un lecteur partagé en utilisant plusieurs techniques ainsi que sur la configuration de deux serveurs et d'un client.
De plus, j'utilise un système d'exploitation différent pour configurer à la fois le serveur et le client, donc les instructions pour effectuer la tâche changent un peu.
Comment configurer un serveur et un client NFS
Mon environnement de laboratoire comprend un serveur NFS et deux clients :

Dans ma configuration, j'aurai trois ordinateurs communiquant entre eux. L'un d'eux sera le serveur NFS et les deux autres seront des clients.
| Machine | OS | Matériel | Mode |
| OrangePi5 | Ubuntu Armbian 23.8.1 jammy | Orange Pi 5 | Serveur:/data |
| RaspberriPi | Debian 20.04.4 LTS (Focal Fossa) | Raspberry Pi 4 Model B Rev 1.4 | Serveur:/var/log/suricata |
| Dmaf5 | Fedora 37 (Workstation Edition) | AMD Ryzen 5 3550H avec Radeon Vega Mobile Gfx | Client |
Comment configurer le serveur
Je vais préparer ma machine OrangePI pour qu'elle soit le serveur NFS. Pour cela, je vais entrer les commandes suivantes :
sudo apt-get update
sudo apt-get upgrade
sudo apt-get install nfs-kernel-server -y
sudo systemctl enable nfs-kernel-server.service --now
L'étape suivante consiste à indiquer au serveur ce que nous voulons partager.
Pour cela, nous allons éditer le fichier /etc/exports (sudo vi /etc/exports history) :
/data *(ro,all_squash,async,no_subtree_check)
Veuillez consulter la page man pour comprendre ce que signifient ces options.
En résumé, l'exportation de /data :
Est en lecture seule
Mappe les ID à un ID anonyme
Cette option permet au serveur NFS de violer le protocole NFS et de répondre aux requêtes avant que les modifications apportées par cette requête n'aient été validées dans un stockage stable
Cette option désactive la vérification des sous-arborescences. C'est le comportement par défaut.
Il est maintenant temps d'activer nos répertoires partagés :
root@orangepi5:~# sudo exportfs -a
root@orangepi5:~# sudo showmount -e
Export list for orangepi5:
/data (everyone)
J'ai fait quelque chose de similaire sur l'autre hôte, raspberrypi :
root@raspberrypi:~# cat /etc/exports
# /etc/exports: the access control list for filesystems which may be exported
# to NFS clients. See exports(5).
#
/var/log/suricata *(ro,all_squash,async,no_subtree_check)
root@raspberrypi:~# showmount -e
Export list for raspberrypi:
/var/log/suricata *
Comment configurer le client
La première chose à faire est de confirmer que nous pouvons effectivement voir les points de montage partagés depuis notre serveur :
(tutorials) [josevnz@dmaf5 SpyOnNfs]$ sudo showmount -e orangepi5
Export list for orangepi5:
/data raspberrypi,dmaf5
Les données sont partagées avec deux machines – exactement ce à quoi nous nous attendions.
Il existe plusieurs façons de monter ce lecteur. L'une d'elles est manuelle, une autre au démarrage, et la dernière, ma préférée, est à la demande.
Comment configurer le client AutoMount sur Fedora Linux
Tout d'abord, nous configurons le service :
sudo dnf install -y autofs
sudo systemct enable autofs.service --now
Ensuite, nous configurons cela pour terminer le montage du /data distant dans le /misc/data local. Pour cela, ajoutez la ligne suivante à votre /etc/auto.master :
[root@dmaf5 ~]# vi /etc/auto.misc
# Après avoir édité le fichier, ajout de notre entrée à la dernière ligne du fichier ...
[root@dmaf5 ~]# cat /etc/auto.misc
#
# This is an automounter map and it has the following format
# key [ -mount-options-separated-by-comma ] location
# Details may be found in the autofs(5) manpage
cd -fstype=iso9660,ro,nosuid,nodev :/dev/cdrom
data -ro,soft,rsize=16384,wsize=16384 orangepi5:/data
suricata -ro,soft,rsize=16384,wsize=16384 raspberrypi:/var/log/suricata
Redémarrez le service une fois de plus :
[root@dmaf5 ~]# systemctl enable autofs.service --now
Et le test de fumée :
[root@dmaf5 ~]# ls -l /misc/data
total 0
drwxrwxr-x. 1 root 1001 48 Apr 7 17:57 nexus
[root@dmaf5 ~]# ls /misc/suricata
certs eve.json.7 files http.log stats.log.1 suricata.log.2 suricata-start.log.3 tls.log.4
core fast.log http-data.log http.log.1 stats.log.2 suricata.log.3 suricata-start.log.4 tls.log.5
eve.json fast.log.1 http-data.log.1 http.log.2 stats.log.3 suricata.log.4 suricata-start.log.5 tls.log.6
eve.json.1 fast.log.2 http-data.log.2 http.log.3 stats.log.4 suricata.log.5 suricata-start.log.6 tls.log.7
eve.json.2 fast.log.3 http-data.log.3 http.log.4 stats.log.5 suricata.log.6 suricata-start.log.7
eve.json.3 fast.log.4 http-data.log.4 http.log.5 stats.log.6 suricata.log.7 tls.log
eve.json.4 fast.log.5 http-data.log.5 http.log.6 stats.log.7 suricata-start.log tls.log.1
eve.json.5 fast.log.6 http-data.log.6 http.log.7 suricata.log suricata-start.log.1 tls.log.2
eve.json.6 fast.log.7 http-data.log.7 stats.log suricata.log.1 suricata-start.log.2 tls.log.3
Nous sommes maintenant prêts à utiliser notre service.
Comment créer un programme Python qui lit des fichiers dans le serveur NFS
Pour notre exemple, nous voulons déterminer si une application Python lit des données depuis ce répertoire. Ce script a deux fonctionnalités :
Effectue une lecture ponctuelle d'un fichier. Cela nous apprendra à capturer ce type de scénarios, lorsqu'un fichier n'est pas ouvert en permanence.
Et le script suit également les mises à jour d'un fichier périodiquement.
Voici à quoi ressemble notre script de test en action :
./scripts/test_script.py \
--quick_read /misc/data/nexus/log/jvm.log \
--follow /misc/suricata/eve.json \
--verbose
...
2023-09-10 14:48:22,889 <dependency_failed type='leaf_type' ctxk='java/io/FileOutputStream' witness='java/net/SocketOutputStream' stamp='66511.794'/>
2023-09-10 14:48:22,889 <dependency_failed type='leaf_type' ctxk='java/io/FileOutputStream' witness='java/net/SocketOutputStream' stamp='66511.794'/>
2023-09-10 14:48:22,889 <dependency_failed type='leaf_type' ctxk='java/io/FileOutputStream' witness='java/net/SocketOutputStream' stamp='66511.794'/>
2023-09-10 14:48:22,889 <dependency_failed type='leaf_type' ctxk='java/io/FileOutputStream' witness='java/net/SocketOutputStream' stamp='66511.794'/>
2023-09-10 14:48:22,889 <dependency_failed type='leaf_type' ctxk='java/io/FileOutputStream' witness='java/net/SocketOutputStream' stamp='66511.794'/>
2023-09-10 14:48:22,889 <dependency_failed type='leaf_type' ctxk='java/io/FileOutputStream' witness='java/net/SocketOutputStream' stamp='66511.794'/>
2023-09-10 14:48:22,889 <dependency_failed type='leaf_type' ctxk='java/io/FileOutputStream' witness='java/net/SocketOutputStream' stamp='66511.794'/>
2023-09-10 14:48:22,890 <dependency_failed type='leaf_type' ctxk='java/io/FileOutputStream' witness='java/net/SocketOutputStream' stamp='66511.794'/>
2023-09-10 14:48:22,890 <dependency_failed type='unique_concrete_method' ctxk='java/io/ByteArrayOutputStream' x='java/io/ByteArrayOutputStream write ([BII)V' witness='sun/security/ssl/HandshakeOutStream' stamp='66511.855'/>
2023-09-10 14:48:22,890 <dependency_failed type='unique_concrete_method' ctxk='java/io/ByteArrayOutputStream' x='java/io/ByteArrayOutputStream write ([BII)V' witness='sun/security/ssl/HandshakeOutStream' stamp='66511.855'/>
...
# Ctrl-C pour quitter
Le code, écrit en Python, est assez simple :
#!/usr/bin/env python
"""
Script simple pour simuler une activité légère sur les lecteurs NFS
Auteur Jose Vicente Nunez (kodegeek.com@protonmail.com)
"""
import concurrent
import os
import time
from concurrent.futures import ThreadPoolExecutor, ALL_COMPLETED
from pathlib import Path
from argparse import ArgumentParser
import logging
logging.basicConfig(format='%(asctime)s %(message)s', encoding='utf-8', level=logging.DEBUG)
def forever_read(the_file: Path, verbose: bool = False):
for line in continuous_read(the_file=the_file):
if verbose:
logging.warning(line.strip())
def continuous_read(the_file: Path):
"""
Lit continuellement le contenu du fichier
:param the_file:
:return:
"""
with open(the_file, 'r') as file_data:
file_data.seek(0, os.SEEK_END)
while True:
line = file_data.readline()
if not line:
time.sleep(0.1)
continue
yield line
def quick_read(the_file: Path, verbose: bool = False):
"""
Lit le fichier entier et le ferme une fois terminé
:param verbose:
:param the_file:
:return:
"""
with open(the_file, 'r') as file_data:
for line in file_data:
if verbose:
logging.warning(line.strip())
if __name__ == "__main__":
PARSER = ArgumentParser(description=__doc__)
PARSER.add_argument(
'--verbose',
action='store_true',
default=False,
help='Activer le mode verbeux'
)
PARSER.add_argument(
'--quick_read',
type=Path,
required=True,
help='Lire un fichier une fois'
)
PARSER.add_argument(
'--follow',
type=Path,
required=True,
help='Lire un fichier en continu'
)
OPTIONS = PARSER.parse_args()
try:
with ThreadPoolExecutor(max_workers=3) as tpe:
futures = [
tpe.submit(forever_read, OPTIONS.follow, OPTIONS.verbose),
tpe.submit(quick_read, OPTIONS.quick_read, OPTIONS.verbose)
]
concurrent.futures.wait(futures, return_when=ALL_COMPLETED)
except KeyboardInterrupt:
pass
Maintenant, voyons comment nous pouvons voir si notre script accède effectivement à une partition NFS.
Étapes communes
Tout d'abord, nous devons apprendre où chercher. Donc sur la machine, vérifiez NFS dans /etc/fstab (pour les points de montage disponibles depuis le redémarrage de la machine) :
[root@dmaf5 ~]# rg -e 'rsize=' /etc/fstab
Ensuite, dans les fichiers AutoMount :
[root@dmaf5 ~]# rg -e 'rsize=' /etc/auto*
/etc/auto.misc
17:data -ro,soft,rsize=16384,wsize=16384 orangepi5:/data
18:suricata -ro,soft,rsize=16384,wsize=16384 raspberrypi:/var/log/suricata
Les expressions régulières ne sont pas une science exacte, mais vous avez une idée de ce qu'il faut chercher ensuite.
Comment utiliser les outils
Nous devons confirmer s'il y a eu accès à l'une des partitions suivantes montées via NFS :
/misc/data/misc/suricata
Ensuite, je vais vous montrer un ensemble d'outils qui faciliteront la tâche, chacun avec ses propres forces et limitations.
Commençons par lsof et ripgrep combinés.
Comment utiliser Lsof et rg pour capturer et filtrer
[josevnz@dmaf5 docs]$ lsof -w -b| rg -e '/misc/data|/misc/suricata'
python 36509 josevnz 3 unknown /misc/suricata/eve.json
python 36509 36510 python josevnz 3 unknown /misc/suricata/eve.json
python 36509 36511 python josevnz 3 unknown /misc/suricata/eve.json
J'ai passé l'option -b à lsof pour éviter qu'il ne se bloque, au cas où le handle NFS serait obsolète.
Quelques points sur lsof :
Si vous utilisez Autofs, vous devez savoir que les points de montage sont éventuellement démontés pour économiser la bande passante. Cela peut poser problème lorsque vous essayez de capturer l'accès à un fichier qui n'est ouvert qu'une seule fois.
La lecture de courte durée n'est pas apparue car le handle de fichier a été fermé après que nous avons inspecté le processus.
Si vous souhaitez surveiller TOUS les processus sur cette machine, vous devrez peut-être exécuter en tant que root. Vous ne pouvez inspecter que vos propres processus sans privilèges spéciaux.
Néanmoins, lsof est un excellent outil d'investigation.
La stratégie suivante consiste à surveiller dès le début, pour capturer la lecture courte et insaisissable. Nous utiliserons strace.
Comment utiliser strace
sudo dnf install -y strace
(tutorials) [josevnz@dmaf5 SpyOnNfs]$ strace -f ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json 2>&1| rg -e '/misc/data|/misc/suricata'
execve("./scripts/test_script.py", ["./scripts/test_script.py", "--quick_read", "/misc/data/nexus/log/jvm.log", "--follow", "/misc/suricata/eve.json"], 0x7ffd9ae29738 /* 46 vars */) = 0
execve("/home/josevnz/virtualenv/tutorials/bin/python", ["python", "./scripts/test_script.py", "--quick_read", "/misc/data/nexus/log/jvm.log", "--follow", "/misc/suricata/eve.json"], 0x7ffe269dbf88 /* 46 vars */) = 0
[pid 38241] openat(AT_FDCWD, "/misc/suricata/eve.json", O_RDONLY|O_CLOEXEC <unfinished ...>
[pid 38242] openat(AT_FDCWD, "/misc/data/nexus/log/jvm.log", O_RDONLY|O_CLOEXEC <unfinished ...>
Les entrées openat(AT_FDCWD) révèlent les deux fichiers que notre script lit depuis NFS. Mais comme vous pouvez le constater, cette approche présente quelques inconvénients :
Nous filtrons la sortie. Il est préférable d'enregistrer la sortie dans un fichier avec 'tee' et de rechercher ensuite
Il nécessite de démarrer le processus avec strace dès le début. Oui, vous pourriez faire un 'strace -p $PID' pour vous attacher plus tard au processus, mais vous risquez de manquer les lectures de courte durée
Y a-t-il une autre façon ? Passons à l'outil suivant, tshark et voyons comment utiliser une capture réseau pour confirmer l'accès au partage.
Comment utiliser tshark
Nous pouvons également capturer le trafic réseau et filtrer uniquement NFS. Ce n'est pas parfait, mais cela peut suffire.
Tout d'abord, découvrez quelle interface réseau est utilisée pour communiquer avec le serveur NFS. Dans mon cas, c'est facile – ils sont tous connectés en utilisant un réseau privé filaire :
[josevnz@dmaf5 docs]$ ip --oneline address|rg -e 'eno|wlp'
3: eno1 inet 192.168.68.70/22 brd 192.168.71.255 scope global dynamic noprefixroute eno1\ valid_lft 4568sec preferred_lft 4568sec
4: wlp4s0 inet 192.168.1.95/24 brd 192.168.1.255 scope global dynamic noprefixroute wlp4s0\ valid_lft 3423sec preferred_lft 3423sec
4: wlp4s0 inet6 fe80::ac40:5365:7f09:a5d2/64 scope link noprefixroute \ valid_lft forever preferred_lft forever
Pour cet exemple, il s'agit de eno1 avec l'adresse IP '192.168.68.70'. Ensuite, capturez le trafic, et avec un peu de chance, nous obtiendrons le chemin du fichier :
[root@dmaf5 ~]# tshark -i eno1 -Y "nfs"
Running as user "root" and group "root". This could be dangerous.
Capturing on 'eno1'
** (tshark:42326) 16:02:47.417145 [Main MESSAGE] -- Capture started.
** (tshark:42326) 16:02:47.417286 [Main MESSAGE] -- File: "/var/tmp/wireshark_eno1rEGxiu.pcapng"
13 1.601197994 192.168.68.70 → 192.168.68.60 NFS 450 V4 Call GETATTR FH: 0x90ba4ee1 ; V4 Call GETATTR FH: 0x90ba4ee1
14 1.601374466 192.168.68.70 → 192.168.68.60 NFS 258 V4 Call GETATTR FH: 0x90ba4ee1
15 1.601395155 192.168.68.70 → 192.168.68.60 NFS 258 V4 Call GETATTR FH: 0x90ba4ee1
16 1.602155254 192.168.68.60 → 192.168.68.70 NFS 310 V4 Reply (Call In 13) GETATTR
17 1.602368826 192.168.68.60 → 192.168.68.70 NFS 554 V4 Reply (Call In 13) GETATTR ; V4 Reply (Call In 14) GETATTR
19 1.602515091 192.168.68.70 → 192.168.68.60 NFS 274 V4 Call READ StateID: 0xa902 Offset: 57552896 Len: 12288
20 1.602557170 192.168.68.60 → 192.168.68.70 NFS 310 V4 Reply (Call In 15) GETATTR
22 1.603156327 192.168.68.60 → 192.168.68.70 NFS 1730 V4 Reply (Call In 19) READ
66 4.611124808 192.168.68.70 → 192.168.68.60 NFS 642 V4 Call GETATTR FH: 0x90ba4ee1 ; V4 Call GETATTR FH: 0x90ba4ee1 ; V4 Call GETATTR FH: 0x90ba4ee1
67 4.611301059 192.168.68.70 → 192.168.68.60 NFS 258 V4 Call GETATTR FH: 0x90ba4ee1
68 4.611809385 192.168.68.60 → 192.168.68.70 NFS 310 V4 Reply (Call In 66) GETATTR
69 4.611887552 192.168.68.60 → 192.168.68.70 NFS 310 V4 Reply (Call In 66) GETATTR
71 4.611976479 192.168.68.60 → 192.168.68.70 NFS 310 V4 Reply (Call In 66) GETATTR
72 4.620685968 192.168.68.60 → 192.168.68.70 NFS 310 V4 Reply (Call In 67) GETATTR
74 5.017200005 192.168.68.70 → 192.168.68.60 NFS 250 V4 Call GETATTR FH: 0x9419c00c
75 5.017804843 192.168.68.70 → 192.168.68.59 NFS 242 V4 Call GETATTR FH: 0x314e720f
76 5.017838787 192.168.68.60 → 192.168.68.70 NFS 310 V4 Reply (Call In 74) GETATTR
77 5.018131217 192.168.68.70 → 192.168.68.60 NFS 326 V4 Call OPEN DH: 0x90ba4ee1/
78 5.018711408 192.168.68.60 → 192.168.68.70 NFS 386 V4 Reply (Call In 77) OPEN StateID: 0x9984
79 5.018855699 192.168.68.59 → 192.168.68.70 NFS 310 V4 Reply (Call In 75) GETATTR
81 5.018980434 192.168.68.70 → 192.168.68.59 NFS 262 V4 Call GETATTR FH: 0xecd332cc
82 5.019934959 192.168.68.59 → 192.168.68.70 NFS 310 V4 Reply (Call In 81) GETATTR
83 5.020032853 192.168.68.70 → 192.168.68.59 NFS 262 V4 Call GETATTR FH: 0x261d4440
84 5.020734032 192.168.68.59 → 192.168.68.70 NFS 310 V4 Reply (Call In 83) GETATTR
85 5.020874175 192.168.68.70 → 192.168.68.59 NFS 330 V4 Call OPEN DH: 0xc9b4831b/
C'est génial, il y a de l'activité contre deux serveurs NFS, 192.168.68.59 et 192.168.68.60. Mais, y a-t-il un moyen de voir le nom des fichiers ?
tshark a un moyen de fournir des informations par champ. Le problème est que NFS en a beaucoup :
[root@dmaf5 ~]# for field in $(tshark -G fields| cut -d' ' -f3|rg -e '^nfs\.'); do echo "-e $field"; done|head -n 10
Running as user "root" and group "root". This could be dangerous.
-e nfs.unknown
-e nfs.svr4
-e nfs.knfsd_le
-e nfs.nfsd_le
-e nfs.knfsd_new
-e nfs.ontap_v3
-e nfs.ontap_v4
-e nfs.ontap_gx_v3
-e nfs.celerra_vnx
-e nfs.gluster
Alors, capturons-les dans une variable (nous devons également activer certaines options) :
[root@dmaf5 ~]# fields=$(for field in $(tshark -G fields| cut -d' ' -f3|rg -e '^nfs\.'); do echo "-e $field"; done)
[root@dmaf5 ~]# tshark -i eno1 --enable-protocol nfs -o nfs.file_name_snooping:true -o nfs.file_full_name_snooping:true -T fields -E header=y -E separator=, -E quote=d $fields
Running as user "root" and group "root". This could be dangerous.
nfs.unknown,nfs.svr4,nfs.knfsd_le,nfs.nfsd_le,nfs.knfsd_new,nfs.ontap_v3,nfs.ontap_v4,nfs.ontap_gx_v3,n...
J'ai réussi à obtenir le nom de fichier une seule fois, puis après avoir interrompu et redémarré le programme, je n'ai plus eu de chance.
Et pourtant, aucun signe du nom de fichier. Le handle de fichier était dans le contenu, mais ce n'est pas très utile si vous voulez une façon rapide de voir ce qui a été accédé.
Y a-t-il un moyen plus facile de faire cela ? Sysdig peut offrir quelques réponses.
Comment utiliser Sysdig
En essayant de trouver les points de montage insaisissables, je suis tombé sur Sysdig :
Sysdig instrument vos machines physiques et virtuelles au niveau du système d'exploitation en s'installant dans le noyau Linux et en capturant les appels système et autres événements du système d'exploitation. Sysdig utilise DTrace pour accéder au noyau du système.
Sysdig permet également de créer des fichiers de trace pour l'activité du système, de manière similaire à ce que vous pouvez faire pour les réseaux avec des outils comme tcpdump et Wireshark.
J'ai décidé d'utiliser la dernière version (0.33.1) pour Fedora 37 où mon script est en cours d'exécution :
sudo dnf install -y https://github.com/draios/sysdig/releases/download/0.33.1/sysdig-0.33.1-x86_64.rpm
# Attendez un peu, car un module noyau doit être compilé et préparé...
Installed:
bison-3.8.2-3.fc37.x86_64 dkms-3.0.11-1.fc37.noarch elfutils-libelf-devel-0.189-3.fc37.x86_64 flex-2.6.4-11.fc37.x86_64 kernel-devel-6.4.13-100.fc37.x86_64
kernel-devel-matched-6.4.13-100.fc37.x86_64 libzstd-devel-1.5.5-1.fc37.x86_64 m4-1.4.19-4.fc37.x86_64 openssl-devel-1:3.0.9-1.fc37.x86_64 sysdig-0.33.1-1.x86_64
zlib-devel-1.2.12-5.fc37.x86_64
À quel point est-il facile de sonder le script pour confirmer qu'il accède effectivement aux répertoires montés NFS ? Imprimons trois champs d'intérêt et le nom du fichier accédé :
# `sysdig -l` affichera chaque champ que vous pouvez capturer
[root@dmaf5 ~]# sysdig -p"%proc.cmdline,%fd.name" proc.name contains python and fd.name contains /misc
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/suricata/eve.json
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/suricata/eve.json
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/suricata/eve.json
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/suricata/eve.json
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/suricata/eve.json
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/suricata/eve.json
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/suricata/eve.json
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/suricata/eve.json
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/data/nexus/log/jvm.log
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/data/nexus/log/jvm.log
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/data/nexus/log/jvm.log
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/data/nexus/log/jvm.log
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/data/nexus/log/jvm.log
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/data/nexus/log/jvm.log
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/data/nexus/log/jvm.log
...
Et si vous souhaitez capturer toutes les données et filtrer plus tard ? Une façon de faire est de capturer dans un fichier :
# Capture pendant une minute...
[root@dmaf5 ~]# timeout --preserve-status 1m sysdig -w /tmp/sysdig.dump
[root@dmaf5 ~]# ls -lh /tmp/sysdig.dump
-rw-r--r--. 1 root root 32M Sep 10 19:03 /tmp/sysdig.dump
Puis relisez le contenu, avec filtrage (la relecture ne nécessite pas de privilèges élevés) :
[root@dmaf5 ~]# sysdig -r /tmp/sysdig.dump -p"%proc.cmdline,%fd.name" proc.name contains python and fd.name contains /misc|sort -u
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/data/nexus/log/jvm.log
python ./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose,/misc/suricata/eve.json
Sysdig prend en charge le scripting, en utilisant le langage LUA. Par exemple, il dispose d'une version très pratique de lsof :
[root@dmaf5 ~]# sysdig -cl|rg lsof
lsof List (and optionally filter) the open file descriptors.
Alors utilisons-le :
[root@dmaf5 ~]# sysdig -c lsof|rg misc
automount 52410 52410 root 8 directory /misc
automount 52410 52413 root 8 directory /misc
automount 52410 52414 root 8 directory /misc
automount 52410 52415 root 8 directory /misc
automount 52410 52418 root 8 directory /misc
automount 52410 52421 root 8 directory /misc
python 75840 75840 josevnz 3 file /misc/suricata/eve.json
python 75840 75841 josevnz 3 file /misc/suricata/eve.json
python 75840 75842 josevnz 3 file /misc/suricata/eve.json
Ce que j'ai aimé dans cet outil :
Peut fonctionner avec des noyaux plus anciens (comme 4.xx)
Dispose d'un langage d'expression puissant pour le filtrage
Facile à apprendre et bien documenté
Vous pouvez écrire vos propres scripts si vous connaissez LUA
Avant de terminer, regardons un autre outil, BPF.
Comment utiliser la sonde BPF
À l'origine Berkeley Packet Filter, est un schéma d'observabilité du noyau et de l'espace utilisateur pour Linux.
Le BPF est un outil très puissant, et cet article court ne fera même pas effleurer la surface.
Oui, c'est énorme. Je l'apprends moi-même.
J'ai trouvé que le dépôt bcc contient de nombreux scripts prêts à l'emploi que nous pourrions utiliser pour suivre notre accès NFS, et même vérifier les performances (vous pouvez trouver plus d'exemples ici, et sur le dépôt BPF Performance Book).
Mais il est plus intéressant d'écrire des outils vous-même qui surveillent à peu près tout ce que vous voulez. Pour ce tutoriel, j'utiliserai certains programmes prêts à l'emploi qui utilisent les traces pour capturer des informations utiles.
En premier lieu, nous devrons installer un interpréteur de haut niveau pour nos scripts. Encore une fois, sur ma machine Fedora Linux :
[josevnz@dmaf5 ~]$ sudo dnf install -y bpftrace.x86_64 bcc-tools.x86_64
# Et vérifiez si le noyau a btf activé
[josevnz@dmaf5 ~]$ ls -la /sys/kernel/btf/vmlinux
-r--r--r--. 1 root root 5635179 Sep 12 04:21 /sys/kernel/btf/vmlinux
Dans un terminal séparé, relancez le script de test NFS :
. ~/virtualenv/tutorials/bin/activate
cd SpyOnNfs/
./scripts/test_script.py --quick_read /misc/data/nexus/log/jvm.log --follow /misc/suricata/eve.json --verbose
Vous pouvez tracer tous les fichiers ouverts par un programme, comme top :
18:59:20 loadavg: 1.20 1.00 0.74 1/1175 28520
TID COMM READS WRITES R_Kb W_Kb T FILE
28520 clear 2 0 60 0 R xterm-256color
28203 python 7 0 56 0 R eve.json
28347 filetop 2 0 15 0 R loadavg
824 systemd-oomd 2 0 8 0 R memory.swap.current
824 systemd-oomd 2 0 8 0 R memory.low
...
Mais il n'imprime pas le chemin complet. Il est plus utile de demander un espion NFS et de voir si l'un de nos fichiers apparaît :
[josevnz@dmaf5 SuricataLog]$ sudo /usr/share/bcc/tools/nfsslower 1
# Commented out some warnings ...
Tracing NFS operations that are slower than 1 ms... Ctrl-C to quit
TIME COMM PID T BYTES OFF_KB LAT(ms) FILENAME
19:02:25 python 28202 R 1460 62150 1.96 eve.json
19:02:28 python 28202 R 2446 62151 2.09 eve.json
19:02:31 python 28202 R 970 62154 1.99 eve.json
19:02:34 python 28202 R 3335 62155 2.43 eve.json
19:02:37 python 28202 R 4564 62158 1.84 eve.json
19:02:40 python 28202 R 5876 62162 1.89 eve.json
19:02:43 python 28202 R 4504 62168 1.61 eve.json
19:02:46 python 28202 R 3131 62173 1.92 eve.json
C'est beaucoup mieux. De plus, nous pouvons voir que la latence est presque de deux millisecondes.
Nous pouvons également surveiller les opérations de montage/démontage :
[josevnz@dmaf5 SuricataLog]$ sudo /usr/share/bcc/tools/mountsnoop
# Commented out some warnings ...
2 warnings generated.
COMM PID TID MNT_NS CALL
mount.nfs 29012 29012 4026531841 mount("orangepi5:/data", "/misc/data", "nfs", MS_RDONLY, "sloppy,soft,rsize=16384,wsize=16384,vers=4.2,addr=192.168.68.59,clientaddr=192.168.68.68") = 0
C'est bien aussi, nous pouvons voir l'activité sur NFS que nous voulions confirmer.
Prochaines étapes
Vous avez appris plusieurs outils et, comme vous l'avez peut-être deviné, vous pouvez les utiliser pour espionner plus que simplement les fichiers ouverts sur NFS.
Il est toujours utile de connaître plus d'un outil. Sysdig mérite une mention spéciale pour être très polyvalent, puissant et pourtant facile à utiliser. De plus, il peut être étendu avec des scripts écrits en langage LUA.
BPF est une autre alternative et vous donnera un accès incroyable aux appels du noyau. Préparez-vous à passer du temps à lire et à apprendre comment utiliser les outils.
Le code des scripts utilisés dans ce tutoriel peut être obtenu depuis mon dépôt GitHub : SpyOnNfs.