Volba úložiště vyhledávacích dat v Azure
Tento článek porovnává technologické volby pro úložiště vyhledávacích dat v Azure. Úložiště vyhledávacích dat slouží k vytváření a ukládání specializovaných indexů pro provádění hledání volného textu. Indexovaný text se může nacházet v samostatném úložišti dat, například v úložišti objektů blob. Aplikace odešle dotaz do úložiště vyhledávacích dat a výsledkem je seznam odpovídajících dokumentů. Další informace o tomto scénáři najdete v tématu Zpracování volného textu pro vyhledávání.
Jaké máte možnosti při výběru úložiště vyhledávacích dat?
V Azure budou všechna následující úložiště dat splňovat základní požadavky na vyhledávání na textová data ve volném formátu poskytnutím vyhledávacího indexu:
- Azure Cognitive Search
- Elasticsearch
- HDInsight s Solrem
- Azure SQL Database s fulltextové vyhledávání
Klíčová kritéria výběru
V případě scénářů hledání začněte výběrem vhodného úložiště vyhledávacích dat podle svých potřeb zodpovězením těchto otázek:
Chcete místo správy vlastních serverů spravovat spravovanou službu?
Můžete zadat schéma indexu v době návrhu? Pokud ne, zvolte možnost, která podporuje aktualizovatelná schémata.
Potřebujete index pouze pro fulltextové vyhledávání nebo potřebujete také rychlou agregaci číselných dat a dalších analýz? Pokud potřebujete funkce nad rámec fulltextového vyhledávání, zvažte možnosti, které podporují další analýzy.
Potřebujete vyhledávací index pro analytiku protokolů s podporou shromažďování protokolů, agregace a vizualizací indexovaných dat? Pokud ano, zvažte Elasticsearch, který je součástí zásobníku Log Analytics.
Potřebujete indexovat data v běžných formátech dokumentů, jako jsou PDF, Word, PowerPoint a Excel? Pokud ano, zvolte možnost, která poskytuje indexery dokumentů.
Má vaše databáze specifické požadavky na zabezpečení? Pokud ano, zvažte funkce zabezpečení uvedené níže.
Matice schopností
Následující tabulky shrnují hlavní rozdíly v možnostech.
Obecné možnosti
| Schopnost | Cognitive Search | Elasticsearch | HDInsight s Solrem | SQL Database |
|---|---|---|---|---|
| Je spravovaná služba | Yes | No | Yes | Yes |
| REST API | Yes | Yes | Yes | No |
| Programovatelnost | .NET, Java, Python, JavaScript | Java | Java | T-SQL |
| Indexery dokumentů pro běžné typy souborů (PDF, DOCX, TXT a tak dále) | Yes | No | Yes | No |
Možnosti správy
| Schopnost | Cognitive Search | Elasticsearch | HDInsight s Solrem | SQL Database |
|---|---|---|---|---|
| Aktualizovatelné schéma | Yes | Yes | Yes | Yes |
| Podporuje horizontální navýšení velikosti. | Yes | Yes | Yes | No |
Možnosti analytických úloh
| Schopnost | Cognitive Search | Elasticsearch | HDInsight s Solrem | SQL Database |
|---|---|---|---|---|
| Podporuje analýzy nad rámec fulltextového vyhledávání. | No | Yes | Yes | Yes |
| Součást zásobníku Log Analytics | No | Ano (ELK) | No | No |
| Podporuje sémantické vyhledávání. | Ano (najít pouze podobné dokumenty) | Yes | Yes | Yes |
Možnosti zabezpečení
| Schopnost | Cognitive Search | Elasticsearch | HDInsight s Solrem | SQL Database |
|---|---|---|---|---|
| Zabezpečení na úrovni řádků | Částečná (vyžaduje dotaz aplikace pro filtrování podle ID skupiny) | Částečná (vyžaduje dotaz aplikace pro filtrování podle ID skupiny) | Yes | Yes |
| Transparentní šifrování dat | No | No | No | Yes |
| Omezení přístupu na konkrétní IP adresy | Yes | Yes | Yes | Yes |
| Omezení přístupu jenom na povolení přístupu k virtuální síti | Yes | Yes | Yes | Yes |
| Ověřování active directory (integrované ověřování) | No | No | No | Yes |