4.2 KiB
Диагностика проблемы с передачей изображений в Ollama
Проблема
Open WebUI не передает изображения в Ollama для модели gemma3n:e4b-it-fp16, хотя:
- ✅ Адрес Ollama правильный:
http://ollama:11434 - ✅ Модель поддерживает vision
- ✅ Изображения загружаются в Open WebUI
- ❌ Но не доходят до Ollama (нет запросов с изображениями в логах)
Возможные причины
1. Open WebUI v0.8.3 не распознает gemma3n как vision-модель
Open WebUI может не знать, что gemma3n:e4b-it-fp16 поддерживает vision. Нужно проверить список vision-моделей в коде.
2. Модель не помечена как vision в настройках
Возможно, нужно явно указать в настройках Open WebUI, что модель поддерживает vision.
3. Проблема с форматом передачи изображений
Open WebUI может передавать изображения в неправильном формате для Ollama API.
Решения
Решение 1: Проверка настроек модели в Open WebUI
- Откройте https://odo.iieasy.ru
- Перейдите в Settings → Models
- Найдите модель
gemma3n:e4b-it-fp16 - Проверьте, есть ли опция "Vision" или "Multimodal"
- Включите её, если есть
Решение 2: Обновление Open WebUI
Версия v0.8.3 может иметь проблемы с vision. Попробуйте обновить до последней версии:
# В docker-compose.yml измените:
image: ghcr.io/open-webui/open-webui:latest
# или
image: ghcr.io/open-webui/open-webui:v1.x.x
Затем:
docker compose pull open-webui
docker compose up -d open-webui
Решение 3: Проверка через прямой API запрос
Проверьте, работает ли vision напрямую через Ollama API:
cd /home/its/iiEasyWeb/test_images
IMAGE_B64=$(base64 -w 0 test_image.jpg)
sudo docker exec ollama curl -s -X POST http://localhost:11434/api/generate \
-H 'Content-Type: application/json' \
-d "{
\"model\": \"gemma3n:e4b-it-fp16\",
\"prompt\": \"Опиши это изображение на русском языке\",
\"images\": [\"$IMAGE_B64\"],
\"stream\": false
}" | jq -r '.response'
Если это работает, значит проблема в Open WebUI, а не в Ollama.
Решение 4: Проверка логов при отправке изображения
-
Откройте два терминала
-
В первом терминале:
sudo docker logs open-webui -f | grep -i "image\|ollama\|generate"
- Во втором терминале:
sudo docker logs ollama -f | grep -i "generate\|image"
-
Отправьте изображение через веб-интерфейс
-
Проверьте, что появляется в логах:
- В Open WebUI должен быть запрос с изображением
- В Ollama должен быть запрос к
/api/generateс полемimages
Решение 5: Проверка версии Open WebUI
sudo docker exec open-webui cat /app/backend/version.txt
Если версия старая, обновите до последней.
Альтернативное решение: Использование API напрямую
Если Open WebUI не поддерживает vision для gemma3n, можно использовать API напрямую или создать свой клиент.
Проверка работы vision модели
Убедитесь, что модель действительно поддерживает vision:
sudo docker exec ollama ollama show gemma3n:e4b-it-fp16
В выводе должна быть информация о поддержке vision/multimodal.