FIX README.md

Alexander Cherednikov · Alexander Cherednikov · commit 4423c72eadc5 · 2025-09-13T10:17:22.000+03:00
diff --git a/README.md b/README.md
@@ -35,7 +35,7 @@
 
 - **Бэкенд**: PHP 8.3 + Symfony 7.3 (MicroKernelTrait)
 - **Векторная БД**: Qdrant (поиск по косинусному сходству)
-- **Эмбеддинги**: Transformers PHP (all-MiniLM-L6-v2, 384 измерения)
+- **Эмбеддинги**: Transformers PHP ([onnx-community/Qwen3-Embedding-0.6B-ONNX](https://huggingface.co/onnx-community/Qwen3-Embedding-0.6B-ONNX), 384 измерения)
 - **LLM**: Ollama + Llama 3.2:1b (локальная инференция)
 - **Инфраструктура**: Docker + Docker Compose
 
@@ -141,6 +141,49 @@ rag-vectors-presentation/
 └── README.md           # Этот файл
 ```
 
+## 🧠 Выбор моделей для векторизации
+
+Проект использует **Transformers PHP** для генерации эмбеддингов. По умолчанию установлена модель `onnx-community/Qwen3-Embedding-0.6B-ONNX`, но вы можете выбрать любую другую модель:
+
+### Доступные модели
+
+Все модели можно найти на [🤗 Hugging Face](https://huggingface.co/models?library=transformers.js&task=feature-extraction) с тегом `transformers.js`:
+
+```php
+// Примеры популярных embedding моделей:
+
+// Компактные модели (быстрые, меньше памяти)
+'onnx-community/all-MiniLM-L6-v2'           // 384 измерения, универсальная
+'onnx-community/all-MiniLM-L12-v2'          // 384 измерения, лучше качество
+
+// Мультиязычные модели (поддержка русского)
+'onnx-community/paraphrase-multilingual-MiniLM-L12-v2'  // 384 измерения
+'onnx-community/Qwen3-Embedding-0.6B-ONNX'              // 384 измерения (используется по умолчанию)
+
+// Мощные модели (больше точность, больше ресурсов)
+'onnx-community/bge-base-en-v1.5'           // 768 измерений, высокое качество
+'onnx-community/e5-large-v2'                // 1024 измерения, топовая точность
+```
+
+### Смена модели
+
+Чтобы использовать другую модель, измените её в файлах:
+
+1. **src/Service/Embedding/TransformersEmbeddingService.php** (строка ~30)
+2. **src/Service/ImprovedRAGService.php** (строка ~200)
+3. **src/Command/ProductsSearchCommand.php** (строка ~68)
+4. **src/Command/ProductsVectorizeCommand.php** (строка ~109)
+
+```php
+// Заменить эту строку:
+$this->embedder = pipeline(Task::Embeddings, 'onnx-community/Qwen3-Embedding-0.6B-ONNX');
+
+// На выбранную модель:
+$this->embedder = pipeline(Task::Embeddings, 'onnx-community/all-MiniLM-L6-v2');
+```
+
+> ⚠️ **Важно**: При смене модели нужно заново проиндексировать товары командой `php bin/console products:vectorize`
+
 ## 🔧 Разработка
 
 ### Проверка качества кода
@@ -252,7 +295,7 @@ SIMILARITY_THRESHOLD=0.7
 ### 1. Этап анализа запроса
 - Пользовательский запрос анализируется Llama 3.2
 - Запрос оптимизируется для лучших результатов поиска
-- Текст преобразуется в 384-мерный вектор с помощью all-MiniLM-L6-v2
+- Текст преобразуется в 384-мерный вектор с помощью Qwen3-Embedding-0.6B-ONNX
 
 ### 2. Этап поиска
 - Семантический поиск в векторной базе Qdrant