Introdução aos índices vetoriais

Um índice de vetores é uma estrutura de dados concebida para permitir que a função VECTOR_SEARCH e a função AI.SEARCH sejam executadas de forma mais eficiente, especialmente em grandes conjuntos de dados.

Exemplos de utilização

Os índices vetoriais melhoram a eficiência da pesquisa vetorial, que é normalmente realizada em incorporações de texto ou multimodais dos seus dados. Os índices vetoriais do BigQuery ajudam a realizar as seguintes tarefas de forma mais eficiente:

  • Fazer pesquisa semântica
  • Detetar imagens, áudio ou vídeos semelhantes ou duplicados
  • Realizar clustering, segmentação ou classificação
  • Crie sistemas de recomendações
  • Encontrar as K imagens ou críticas mais semelhantes a uma determinada entrada

Para mais informações, consulte o artigo Introdução à pesquisa vetorial.

Preços

A declaração CREATE VECTOR INDEX usa os preços de computação do BigQuery. Não existe qualquer custo para o processamento necessário para criar e atualizar os seus índices vetoriais, desde que o tamanho total dos dados da tabela indexada esteja abaixo do seu limite por organização. Para suportar a indexação além deste limite, tem de fornecer a sua própria reserva para processar as tarefas de gestão de índices.

O armazenamento também é uma consideração para os índices. A quantidade de bytes armazenados como um índice está sujeita a custos de armazenamento ativos.

  • Os índices vetoriais incorrem em custos de armazenamento quando estão ativos.
  • Pode encontrar o tamanho do armazenamento do índice através da vista INFORMATION_SCHEMA.VECTOR_INDEXES. Se o índice vetorial ainda não tiver uma cobertura de 100%, continua a ser cobrado por tudo o que foi indexado. Pode verificar a cobertura do índice através da vista INFORMATION_SCHEMA.VECTOR_INDEXES.

Quotas e limites

Para mais informações, consulte o artigo Limites do índice vetorial.

O que se segue?