Files
iiEsaywebUI/TEST_VISION.md

94 lines
4.6 KiB
Markdown
Raw Permalink Normal View History

# Тестирование Vision Capabilities модели gemma3n:e4b-it-fp16
## Быстрый тест через скрипт
Запустите скрипт с правами sudo:
```bash
cd /home/its/iiEasyWeb
sudo ./scripts/test_vision.sh
```
Скрипт автоматически:
1. Проверит, что контейнер Ollama запущен
2. Проверит, что модель gemma3n:e4b-it-fp16 загружена
3. Скачает тестовое изображение
4. Отправит запрос к Ollama API с изображением
5. Покажет ответ модели
## Ручной тест через терминал
Если скрипт не работает, выполните команды вручную:
### 1. Проверка контейнера и модели
```bash
# Проверка контейнера
sudo docker ps | grep ollama
# Проверка загруженных моделей
sudo docker exec ollama ollama list
```
### 2. Подготовка изображения
```bash
cd /home/its/iiEasyWeb
mkdir -p test_images
cd test_images
# Скачайте тестовое изображение
curl -L -o test_image.jpg "https://yandex-images.clstorage.net/PU5vN2154/532297ZKm/lCuSfyMn0DdbJqcFVeFiB9Ti31Te2dZ1EepiRw3Cs0Qw8cQ1ND5OQRKC1yH4LnhdRtloQ4aXHng5ZSLNmXHy_8k293YSMsBWKnOvYAXBbhPcl6pYmqi-ZGWDazZo2pYkJNHpkJHrg5yiO0bEOIeEICe5cFqrojYgyNQ6mHj4e5IUb_Lri3uxo9fmXv0dMf7f1NvH9J5YVsyhRvvmtD9eTc1QfVxV42d8OotKrLTDfHx7jfDqjpIqHAyt9ngIIHsSjLtOJ7_jTYdHLn4hJWlCj_jj69gGlApIBYaTfoxPrtHFDGlYUd-PjHI3hijAm6hIb-lUFlpOehQAJTbwEGwjcqjjVns323WrR2q6CalVyg9kZ8s0jkBm8OVGr26UH86NHaD1rKnPH6zinwJIKBv8VEdF_FrGLt6QFOVqFOQY776w47YDNy8Biwfefg0lxVaL2E9L5NbAztwh8vuCcMNSEfG8aYQFBxe0Eu9CMPhz1Axz1dgqmkpSYCAR8nSA_GMSKKPa9-tzIUc7ooKthV1ykwSjrzhORKq0eRrvBlTbajF5yAUoVX-7XM7HouyU51xMaxFMBl7atixQFW4o1BznMoi_chuL8_mTO_IKce21CosEQ6Owkkhi9EGSz5pIE56NjURBxKn7pwTKt6K4FB_YYHexZG4qlsIg8GVaiJyIB0p0bx5PF4_FIy-SItWZId5f8M9_RIqg2hRVCqP2hDvSfWGAYUjJd6c8lr9mgGj7kPQbVQBCUgIm1NB9lsxQrIO-wO92fytbOQsjjiqBqa0CK9Qjy6wi6CoIfX5vZjw_pj1BKGm0UVOXuArPFngIN2AUgz3w4mZSTvz8IQYo_IhPVlQ7PiOjhyWD6wZSVZ3NDrvsC-8w4lxmzE32T1qMuy5JOTRxaNHHH0QCp4IkgMv8LH8JeJaOUj4sVOGCBBgQi5KMX74TQzOBW9cGTu35UZr3qAfj5O6kMogxjqNanMOs"
```
### 3. Тест через Ollama API
```bash
# Закодируйте изображение в base64
IMAGE_B64=$(base64 -w 0 test_image.jpg)
# Отправьте запрос к Ollama API
sudo docker exec ollama sh -c "curl -s -X POST http://localhost:11434/api/generate \
-H 'Content-Type: application/json' \
-d '{
\"model\": \"gemma3n:e4b-it-fp16\",
\"prompt\": \"Опиши это изображение на русском языке. Что ты видишь на картинке?\",
\"images\": [\"'$IMAGE_B64'\"],
\"stream\": false
}' | jq -r '.response'"
```
Если `jq` не установлен, используйте:
```bash
sudo docker exec ollama sh -c "curl -s -X POST http://localhost:11434/api/generate \
-H 'Content-Type: application/json' \
-d '{
\"model\": \"gemma3n:e4b-it-fp16\",
\"prompt\": \"Опиши это изображение на русском языке. Что ты видишь на картинке?\",
\"images\": [\"'$IMAGE_B64'\"],
\"stream\": false
}'" | grep -o '"response":"[^"]*"' | sed 's/"response":"\(.*\)"/\1/' | sed 's/\\n/\n/g' | sed 's/\\"/"/g'
```
## Тест через веб-интерфейс Open WebUI (рекомендуется)
1. Откройте Open WebUI: https://odo.iieasy.ru
2. Выберите модель: **gemma3n:e4b-it-fp16**
3. Найдите кнопку загрузки изображения в поле ввода (обычно иконка скрепки 📎 или фото 📷)
4. Загрузите изображение: `/home/its/iiEasyWeb/test_images/test_image.jpg`
5. Задайте вопрос: **"Опиши это изображение на русском языке. Что ты видишь на картинке?"**
## Ожидаемый результат
Модель должна описать содержимое изображения:
- Объекты на картинке
- Цвета и композицию
- Детали и контекст
Если модель не видит изображение, проверьте:
- Поддерживает ли модель vision (gemma3n:e4b-it-fp16 поддерживает)
- Правильно ли загружается изображение в интерфейсе
- Логи: `sudo docker logs ollama --tail 50`
- Логи Open WebUI: `sudo docker logs open-webui --tail 50`