Files
iiEsaywebUI/TEST_VISION.md
2026-02-19 18:12:09 +00:00

94 lines
4.6 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# Тестирование Vision Capabilities модели gemma3n:e4b-it-fp16
## Быстрый тест через скрипт
Запустите скрипт с правами sudo:
```bash
cd /home/its/iiEasyWeb
sudo ./scripts/test_vision.sh
```
Скрипт автоматически:
1. Проверит, что контейнер Ollama запущен
2. Проверит, что модель gemma3n:e4b-it-fp16 загружена
3. Скачает тестовое изображение
4. Отправит запрос к Ollama API с изображением
5. Покажет ответ модели
## Ручной тест через терминал
Если скрипт не работает, выполните команды вручную:
### 1. Проверка контейнера и модели
```bash
# Проверка контейнера
sudo docker ps | grep ollama
# Проверка загруженных моделей
sudo docker exec ollama ollama list
```
### 2. Подготовка изображения
```bash
cd /home/its/iiEasyWeb
mkdir -p test_images
cd test_images
# Скачайте тестовое изображение
curl -L -o test_image.jpg "https://yandex-images.clstorage.net/PU5vN2154/532297ZKm/lCuSfyMn0DdbJqcFVeFiB9Ti31Te2dZ1EepiRw3Cs0Qw8cQ1ND5OQRKC1yH4LnhdRtloQ4aXHng5ZSLNmXHy_8k293YSMsBWKnOvYAXBbhPcl6pYmqi-ZGWDazZo2pYkJNHpkJHrg5yiO0bEOIeEICe5cFqrojYgyNQ6mHj4e5IUb_Lri3uxo9fmXv0dMf7f1NvH9J5YVsyhRvvmtD9eTc1QfVxV42d8OotKrLTDfHx7jfDqjpIqHAyt9ngIIHsSjLtOJ7_jTYdHLn4hJWlCj_jj69gGlApIBYaTfoxPrtHFDGlYUd-PjHI3hijAm6hIb-lUFlpOehQAJTbwEGwjcqjjVns323WrR2q6CalVyg9kZ8s0jkBm8OVGr26UH86NHaD1rKnPH6zinwJIKBv8VEdF_FrGLt6QFOVqFOQY776w47YDNy8Biwfefg0lxVaL2E9L5NbAztwh8vuCcMNSEfG8aYQFBxe0Eu9CMPhz1Axz1dgqmkpSYCAR8nSA_GMSKKPa9-tzIUc7ooKthV1ykwSjrzhORKq0eRrvBlTbajF5yAUoVX-7XM7HouyU51xMaxFMBl7atixQFW4o1BznMoi_chuL8_mTO_IKce21CosEQ6Owkkhi9EGSz5pIE56NjURBxKn7pwTKt6K4FB_YYHexZG4qlsIg8GVaiJyIB0p0bx5PF4_FIy-SItWZId5f8M9_RIqg2hRVCqP2hDvSfWGAYUjJd6c8lr9mgGj7kPQbVQBCUgIm1NB9lsxQrIO-wO92fytbOQsjjiqBqa0CK9Qjy6wi6CoIfX5vZjw_pj1BKGm0UVOXuArPFngIN2AUgz3w4mZSTvz8IQYo_IhPVlQ7PiOjhyWD6wZSVZ3NDrvsC-8w4lxmzE32T1qMuy5JOTRxaNHHH0QCp4IkgMv8LH8JeJaOUj4sVOGCBBgQi5KMX74TQzOBW9cGTu35UZr3qAfj5O6kMogxjqNanMOs"
```
### 3. Тест через Ollama API
```bash
# Закодируйте изображение в base64
IMAGE_B64=$(base64 -w 0 test_image.jpg)
# Отправьте запрос к Ollama API
sudo docker exec ollama sh -c "curl -s -X POST http://localhost:11434/api/generate \
-H 'Content-Type: application/json' \
-d '{
\"model\": \"gemma3n:e4b-it-fp16\",
\"prompt\": \"Опиши это изображение на русском языке. Что ты видишь на картинке?\",
\"images\": [\"'$IMAGE_B64'\"],
\"stream\": false
}' | jq -r '.response'"
```
Если `jq` не установлен, используйте:
```bash
sudo docker exec ollama sh -c "curl -s -X POST http://localhost:11434/api/generate \
-H 'Content-Type: application/json' \
-d '{
\"model\": \"gemma3n:e4b-it-fp16\",
\"prompt\": \"Опиши это изображение на русском языке. Что ты видишь на картинке?\",
\"images\": [\"'$IMAGE_B64'\"],
\"stream\": false
}'" | grep -o '"response":"[^"]*"' | sed 's/"response":"\(.*\)"/\1/' | sed 's/\\n/\n/g' | sed 's/\\"/"/g'
```
## Тест через веб-интерфейс Open WebUI (рекомендуется)
1. Откройте Open WebUI: https://odo.iieasy.ru
2. Выберите модель: **gemma3n:e4b-it-fp16**
3. Найдите кнопку загрузки изображения в поле ввода (обычно иконка скрепки 📎 или фото 📷)
4. Загрузите изображение: `/home/its/iiEasyWeb/test_images/test_image.jpg`
5. Задайте вопрос: **"Опиши это изображение на русском языке. Что ты видишь на картинке?"**
## Ожидаемый результат
Модель должна описать содержимое изображения:
- Объекты на картинке
- Цвета и композицию
- Детали и контекст
Если модель не видит изображение, проверьте:
- Поддерживает ли модель vision (gemma3n:e4b-it-fp16 поддерживает)
- Правильно ли загружается изображение в интерфейсе
- Логи: `sudo docker logs ollama --tail 50`
- Логи Open WebUI: `sudo docker logs open-webui --tail 50`