Les fichiers de DJI Osmo Pocket 3

Grâce à Jason, un ami anglais avec qui je correspond depuis maintenant Juillet 2023 par Skype au départ, puis par Microsoft Teams, j’ai découvert, et acheté dès sa sortie en France, la caméra DJI OSMO Pocket 3 qui a des fonctionnalités impressionnantes. J’en reparlerai sans doute dans ce blog un jour prochain. Mais comme vous le savez, mon propos n’est pas d’expliquer comment filmer ou utiliser la caméra, mais plutôt d’évoquer les traitements informatiques que je réalise pour faciliter l’exploitation des fichiers vidéos produits par cette caméra chinoise.
Je commence aujourd’hui par un commentaire sur les fichiers que cette caméra produit lorsqu’on capture une vidéo, car je trouve peu d’informations sur internet pour expliquer leur nature exacte. Même ChatGPT n’a pas été capable de me donner toutes les informations voulues et j’ai dû bidouiller pour trouver ce qu’il me fallait.
Les fichiers produits par DJI Osmo Pocket 3 dépendent naturellement des paramètres qu’on a choisis pour effectuer les captures. Pour ma part, je capture généralement au format 16×9, en 4K et 25 ips (images/secondes). On peut modifier ces paramètres en balayant le petit écran du DJI de bas vers le haut quand on est en mode Vidéo. J’ai parfois changé le format en 1080p quand j’avais besoin de fichiers plus faciles à manier que les gros fichiers 4K. Je n’ai jamais touché aux paramètres audio à ce stade, donc je filme forcément au format par défaut qui est paramétré dans DJI.
Quand je connecte le DJI Osmo Pocket 3 sur mon ordinateur et que je demande le mode « transfert de fichiers » alors se crée dans l’explorateur de Windows 11 un dossier qui, chez moi, s’appelle simplement « Lecteur USB (D:) ». Il prend la lettre D. et fonctionne comme une clé usb externe.
Ce lecteur comprend deux dossiers: DCIM et MISC, et comme sur toutes les clés usb, un dossier caché « System Volume Information » dont je ne m’occupe pas.
Le dossier DCIM
Comme sur tous les appareils photos numériques, les smartphones et les caméras numériques, c’est le dossier où sont enregistrés les principaux fichiers vidéo ou photos que l’on a capturés. D’ailleurs DCIM signifie Digital Camera IMages.
Il contient un sous-dossier DJI_001 qui a sans doute vocation parfois à être complété par un DJI_002 quand il est plein. Mais cela ne m’est encore jamais arrivé. Et au sein de ce dossier DJI_001 on trouve effectivement les fichiers capturés. Ils sont tous de la forme DJI_YYYYMMDDHHMMSS_xxxx_D.eee où YYYY est l’année de capture, par exemple 2025, où MM est le mois de capture, par exemple 10 pour Octobre, DD est le jour de Capture, par exemple 27 pour le 27 octobre 2025. HH est l’heure de capture, par exemple 15. MM est la minute de capture par exemple 06. SS est la seconde de capture, par exemple 54. Dans l’exemple, la capture aurait donc été faite à 15 heures, 06 minutes et 54 secondes.
xxxx est un numéro d’ordre qui est incrémenté à chaque nouvelle capture. Quand le dossier est vide, il commence à 0001 et ensuite augmente d’une unité à chaque fois. On peut donc effectuer 9.999 captures avant de saturer la numérotation. C’est peut-être ensuite que l’on recommencera avec un sous-dossier DJI_002. Je ne l’ai pas testé.
Enfin, eee est une extension. Chez moi elle peut être MP4, ou LRF pour les vidéos WAV pour les audios et JPG ou DNJ pour les photos.
MP4 est le fichier vidéo principal qui a été produit. Quand je l’analyse avec le lecteur VLC, je trouve ses codecs et formats de la forme suivante:
- Vidéo: MPEG-H Part2/HEVC (H.265) (hvc1) 3840×2160 débit 25
- Audio: MPEG AAC Audio (mp4a) Stéréo 48000 Hz 32 bits.
LRF est un fichier mp4 de plus basse résolution que le fichier MP4. Pour l’exploiter et par exemple le lire dans VLC, il suffit de changer son extension en mp4. Pour ne pas le confondre avec le fichier Vidéo de Haute résolution, je change en général son extension en _lrf.mp4. VLC me donne les codecs et formats suivants:
- Vidéo: H264 – MPEG -4 AVC (part10) (avc1) 1280×720 débit 25
- Audio: MPEG AAC Audio (mp4a) Stéréo 48000 Hz 32 bits.
On voit ici que l’audio est inchangé, mais que la taille de la vidéo a drastiquement baissé: La hauteur et la largeur de l’image ont été chacun divisés par 3, ce qui fait une division par 9 du nombre de pixels de l’image. En outre le codec de compression H.265 qui est très performant mais encore peu compatible avec beaucoup de hardware et software a été remplacé par H.264 qui est au contraire très répandu.
WAV est évidemment un fichier audio associé. L’analyse par VLC donne le codec et format suivant:
- Audio: PCM S16 LE (s16l) Stéréo 48000 Hz 16 bits.
A noter que si vous prenez des photos avec le DJI Osmo Pocket 3, celles-ci donneront aussi un fichier logé dans le dossier DCIM, mais avec l’extension JPG. Et si vous avez choisi l’option d’avoir aussi les photos au format RAW (balayer l’écran de droite à gauche pour pouvoir sélectionner la valeur JPG+RAW dans la rubrique jpeg) alors vous obtiendrez en plus un fichier d’extension DNG, toujours dans le dossier DCIM. C’est une image non compressée, donc qui prend beaucoup plus de place que l’image jpg correspondante. Ce n’est pas une image jpg mais en fait une image bmp. Si on change l’extension en bmp, ou en _dng.bmp comme je le fais pour rappeler que c’était une image DNG, alors on peut l’ouvrir dans les éditeurs d’images. Par exemple chez moi on obtient
- JPG: dimensions 3840×2160 résolution (horizontale et verticale) 96 ppp profondeur de couleurs 24.
- DNG: dimensions 1280×720 résolution 96 ppp et profondeur de couleurs 24.
Pour une même image capturée, le fichier JPG pèse 6,12 Mo alors que le fichier DNG, pourtant avec une taille d’image 9 fois plus réduite, pèse 16,7 Mo.
Le dossier MISC
Le dossier MISC (comme MISCellaneous, ce qui signifie « divers ») contient chez moi deux sous-dossiers. L’un s’appelle IDX et devrait être un dossier d’index. Chez moi il est resté jusqu’ici vide. L’autre s’appelle THM et contient lui aussi un sous-dossier DJI_001 dans lequel on trouve des fichiers au format ci-dessus indiqué, mais avec des extensions THX ou SCR.
On voit assez facilement en cherchant sur internet que les fichiers THM sont des thumbnails, de petits fichiers images qui peuvent servir de vignette. Je pense que ces images sont utilisées pour afficher un tableau des vidéos enregistrées quand on balaie le petit écran tactile de gauche vers la droite et qu’on clique en haut à gauche sur les petits carrés.
Pour les exploiter il suffit de changer leur extension en jpg, ou si vous êtes comme moi en _thm.jpg ce qui permet de rappeler que c’était des fichiers THM. Une fois l’extension changée en jpg, un simple clic droit sur le fichier dans Windows permet de lire les principales données EXIF du fichier (Propriétés/Détails). On trouve alors:
- THM: taille 160×90 résolution (verticale et horizontale) 96 ppp profondeur de couleurs 24.
C’est donc effectivement une image miniature.
Pour les fichiers d’extension SCR il a fallu regarder d’un peu plus près car je n’ai rien trouvé sur internet. Parfois les gens se laissent tromper par l’extension scr qui semble indiquer un économiseur d’écran pour Windows. C’est là que même ChatGPT a séché et n’a rien pu me dire. Je lui donne donc la bonne interprétation: les fichiers SCR produits par DJI Osmo Pocket 3 sont aussi des images jpg, mais de plus grand format. Si je change l’extension en _scr.jpg et que je clique droit sur Propriétés puis sur Détails je trouve le format:
- SCR: taille 1280×720 résolution (vert et horz) 96 ppp profondeur de couleurs 24.
On voit que chaque dimension de l’image est 8 fois plus grande que la dimension correspondante du THM, et que donc le nombre de pixels est 64 fois plus important.
Si vous voulez une autre preuve que les THM et les SCR sont de vrais fichiers jpg, ouvrez les avec un éditeur hexadécimal comme l’excellent HxD. Vous verrez alors que les premiers octets de ces fichiers sont FF D8 FF E0 00 10 4A 46 49 46 ce qui est exactement la signature d’un fichier jpg. Il comprend notamment l’identifiant JFIF à partir de la position 06.
Dans le dossier MISC, à la racine du dossier, on peut aussi trouver un fichier d’extension db. Chez moi il s’appelle par exemple PP-101.db. On peut noter que PP-101 est le nom interne de ma caméra. C’est un fichier de base de données au format standard sqlite3. Avec un certain nombre d’outils comme par exemple l’excellent SQLITESpy.exe de Ralf Junker on peut analyser ce qu’il contient. Pour ne pas alourdir ce post du blog, je n’en détaille pas le contenu ici. J’ai l’impression qu’il conserve toutes sortes d’informations sur tous les fichiers qui ont été créés dans le DJI Osmo Pocket 3, logées dans 7 tables de données. Si j’ai le temps d’analyser cela, et si j’y vois une utilité, je vous en dirai davantage dans un prochain blog.

