Dieses Tool verwendet das Multimodale Modell **LLaVA** auf Ihrem lokalen **Ollama**-Server, um Beschreibungen für Bilder und Video-Thumbnails zu erstellen.