Files
iiEsaywebUI/TEST_VISION.md
2026-02-19 18:12:09 +00:00

4.6 KiB
Raw Permalink Blame History

Тестирование Vision Capabilities модели gemma3n:e4b-it-fp16

Быстрый тест через скрипт

Запустите скрипт с правами sudo:

cd /home/its/iiEasyWeb
sudo ./scripts/test_vision.sh

Скрипт автоматически:

  1. Проверит, что контейнер Ollama запущен
  2. Проверит, что модель gemma3n:e4b-it-fp16 загружена
  3. Скачает тестовое изображение
  4. Отправит запрос к Ollama API с изображением
  5. Покажет ответ модели

Ручной тест через терминал

Если скрипт не работает, выполните команды вручную:

1. Проверка контейнера и модели

# Проверка контейнера
sudo docker ps | grep ollama

# Проверка загруженных моделей
sudo docker exec ollama ollama list

2. Подготовка изображения

cd /home/its/iiEasyWeb
mkdir -p test_images
cd test_images

# Скачайте тестовое изображение
curl -L -o test_image.jpg "https://yandex-images.clstorage.net/PU5vN2154/532297ZKm/lCuSfyMn0DdbJqcFVeFiB9Ti31Te2dZ1EepiRw3Cs0Qw8cQ1ND5OQRKC1yH4LnhdRtloQ4aXHng5ZSLNmXHy_8k293YSMsBWKnOvYAXBbhPcl6pYmqi-ZGWDazZo2pYkJNHpkJHrg5yiO0bEOIeEICe5cFqrojYgyNQ6mHj4e5IUb_Lri3uxo9fmXv0dMf7f1NvH9J5YVsyhRvvmtD9eTc1QfVxV42d8OotKrLTDfHx7jfDqjpIqHAyt9ngIIHsSjLtOJ7_jTYdHLn4hJWlCj_jj69gGlApIBYaTfoxPrtHFDGlYUd-PjHI3hijAm6hIb-lUFlpOehQAJTbwEGwjcqjjVns323WrR2q6CalVyg9kZ8s0jkBm8OVGr26UH86NHaD1rKnPH6zinwJIKBv8VEdF_FrGLt6QFOVqFOQY776w47YDNy8Biwfefg0lxVaL2E9L5NbAztwh8vuCcMNSEfG8aYQFBxe0Eu9CMPhz1Axz1dgqmkpSYCAR8nSA_GMSKKPa9-tzIUc7ooKthV1ykwSjrzhORKq0eRrvBlTbajF5yAUoVX-7XM7HouyU51xMaxFMBl7atixQFW4o1BznMoi_chuL8_mTO_IKce21CosEQ6Owkkhi9EGSz5pIE56NjURBxKn7pwTKt6K4FB_YYHexZG4qlsIg8GVaiJyIB0p0bx5PF4_FIy-SItWZId5f8M9_RIqg2hRVCqP2hDvSfWGAYUjJd6c8lr9mgGj7kPQbVQBCUgIm1NB9lsxQrIO-wO92fytbOQsjjiqBqa0CK9Qjy6wi6CoIfX5vZjw_pj1BKGm0UVOXuArPFngIN2AUgz3w4mZSTvz8IQYo_IhPVlQ7PiOjhyWD6wZSVZ3NDrvsC-8w4lxmzE32T1qMuy5JOTRxaNHHH0QCp4IkgMv8LH8JeJaOUj4sVOGCBBgQi5KMX74TQzOBW9cGTu35UZr3qAfj5O6kMogxjqNanMOs"

3. Тест через Ollama API

# Закодируйте изображение в base64
IMAGE_B64=$(base64 -w 0 test_image.jpg)

# Отправьте запрос к Ollama API
sudo docker exec ollama sh -c "curl -s -X POST http://localhost:11434/api/generate \
  -H 'Content-Type: application/json' \
  -d '{
    \"model\": \"gemma3n:e4b-it-fp16\",
    \"prompt\": \"Опиши это изображение на русском языке. Что ты видишь на картинке?\",
    \"images\": [\"'$IMAGE_B64'\"],
    \"stream\": false
  }' | jq -r '.response'"

Если jq не установлен, используйте:

sudo docker exec ollama sh -c "curl -s -X POST http://localhost:11434/api/generate \
  -H 'Content-Type: application/json' \
  -d '{
    \"model\": \"gemma3n:e4b-it-fp16\",
    \"prompt\": \"Опиши это изображение на русском языке. Что ты видишь на картинке?\",
    \"images\": [\"'$IMAGE_B64'\"],
    \"stream\": false
  }'" | grep -o '"response":"[^"]*"' | sed 's/"response":"\(.*\)"/\1/' | sed 's/\\n/\n/g' | sed 's/\\"/"/g'

Тест через веб-интерфейс Open WebUI (рекомендуется)

  1. Откройте Open WebUI: https://odo.iieasy.ru
  2. Выберите модель: gemma3n:e4b-it-fp16
  3. Найдите кнопку загрузки изображения в поле ввода (обычно иконка скрепки 📎 или фото 📷)
  4. Загрузите изображение: /home/its/iiEasyWeb/test_images/test_image.jpg
  5. Задайте вопрос: "Опиши это изображение на русском языке. Что ты видишь на картинке?"

Ожидаемый результат

Модель должна описать содержимое изображения:

  • Объекты на картинке
  • Цвета и композицию
  • Детали и контекст

Если модель не видит изображение, проверьте:

  • Поддерживает ли модель vision (gemma3n:e4b-it-fp16 поддерживает)
  • Правильно ли загружается изображение в интерфейсе
  • Логи: sudo docker logs ollama --tail 50
  • Логи Open WebUI: sudo docker logs open-webui --tail 50