Compartilhar via


Índice de Semântica do Copilot

O índice semântico é um novo recurso de pesquisa do Microsoft 365 que usa o Microsoft Graph para interagir melhor com seus dados pessoais e da sua organização. O recurso cria um novo índice que habilita o futuro das experiências de Pesquisa e do Copilot. O índice semântico segue a segurança e as políticas do Microsoft Graph. Sempre que um utilizador consulta, seja através da pesquisa ou no Microsoft Copilot, é sempre com o contexto de segurança do utilizador e apenas os conteúdos a que um utilizador pode aceder são apresentados.

Visão Geral

O índice semântico tem como base o Microsoft Graph, que interpreta as consultas do usuário para produzir respostas contextualmente relevantes que ajudam a aumentar sua produtividade. Além disso, permite que as organizações pesquisem em bilhões de vetores (representações matemáticas de recursos ou atributos) e retornem os resultados relacionados. Combinado com as melhorias no Microsoft Graph, o índice semântico conecta você às informações relevantes na sua organização e se baseia na abordagem abrangente da Microsoft com relação à segurança, conformidade e privacidade, além de respeitar todos os limites da organização no seu locatário.

O que é um índice?

O conceito de indexação de dados é bem-estabelecido no Microsoft 365 e uma parte normal da forma como o Microsoft Graph funciona atualmente para acessar a enorme quantidade de dados no seu locatário do Microsoft 365. Os usuários veem os resultados da pesquisa do Microsoft Graph, que indexa o conteúdo e os sinais da maioria dos aplicativos do Microsoft 365 no seu locatário para garantir que os resultados da pesquisa sejam personalizados e sua visibilidade elevada com base nas suas conexões entre o conteúdo e as pessoas na sua rede.

As interações com os dados no Microsoft Graph se baseiam na correspondência de palavras-chave, na personalização e na equiparação em redes sociais. A pesquisa de palavras-chave consulta um índice no Microsoft Graph, que mapeia para locais em documentos ou em um conjunto de documentos. O Microsoft 365 usa o Microsoft Graph para classificar o conteúdo mais relevante com base no respectivo conhecimento de sinais adicionais para os usuários e sua rede mais próxima. Isso é conhecido como personalização e equiparação social no Microsoft 365, o que impulsiona a relevância das consultas com relação ao conteúdo na sua organização. O acesso aos dados do locatário no Microsoft Graph é limitado pelo controle de acesso baseado em função. As organizações estão sempre no controle dos recursos da Pesquisa da Microsoft, por meio do portal de Pesquisa e Inteligência no centro de administração do Microsoft 365.

Como o índice semântico ajuda a gerenciar seus dados

O índice semântico aprimora os recursos do Microsoft 365 que permitem que você encontre conteúdo relevante, baseados em palavras-chave, preferências pessoais e conexões na rede social. Faz isso criando índices de vetor que permitem um entendimento conceitual, o que ajuda a identificar o que você está procurando e ajuda você a acessar o conteúdo da organização de que você precisa. Um vetor é uma representação numérica de uma palavra, pixel de imagem ou outros pontos de dados. O vetor é organizado ou mapeado com números próximos, colocados próximos uns dos outros para representar a similaridade. Ao contrário de um índice de palavras-chave padrão, os vetores são armazenados em espaços multidimensionais nos quais pontos de dados semanticamente semelhantes são agrupados no espaço de vetor, permitindo que o Microsoft 365 manipule um conjunto mais amplo de consultas de pesquisa além da "correspondência exata". O gráfico a seguir usa texto (em vez dos números usados por índices de vetores) para mostrar um exemplo de similaridade entre pontos de dados:

Gráfico mostrando um exemplo de como os pontos de dados para um Índice Semântico são clusterizados juntos.

O índice semântico fornece pesquisas de similaridade rápidas e precisas e recuperação de dados com base na distância do respectivo vetor ou similaridade. Isso significa que, em vez de usar métodos tradicionais de consulta com base em correspondências exatas ou critérios predefinidos, o índice semântico pode encontrar os dados mais semelhantes ou relevantes com base no significado semântico ou contextual.

Recursos

Os recursos de índice semântico a seguir fazem mais do que aprimorar os resultados da pesquisa: trabalham em conjunto, para ajudar você a entender seus dados e encontrar informações mais rapidamente, aumentando a produtividade. Os usuários poderão interagir com o índice semântico, inicialmente, por meio da integração do Microsoft Copilot para Microsoft 365. Ao longo do tempo, a Microsoft também irá aprimorar a experiência de pesquisa no SharePoint Online, no Microsoft Teams e no Microsoft 365 com o índice semântico. Estamos implantando o índice semântico para nossos clientes do Microsoft 365 E3/E5 e do Microsoft 365 Business Standard e Business Premium. Também estamos ampliando o índice semântico para incluir os usuários do Microsoft 365 A3 e A5, do Office 365 E3 e E5 com uma licença paga do Copilot. As atualizações de status referentes à disponibilidade são compartilhadas por meio do centro de administração do Microsoft 365 e do roteiro público do Microsoft 365. Confira abaixo os detalhes de como cada recurso funciona quando você procura informações.

Microsoft Copilot com chat baseado no Graph

O índice semântico ajuda a expor os resultados dentro do Microsoft Copilot com o chat baseado no Graph ao entender a intenção da sua consulta e acrescentar informações adicionais ao seu prompt do Microsoft Copilot. As informações relevantes são obtidas no Microsoft Graph e no índice semântico para fornecer ao LLM mais informações para levar em conta. Por exemplo, suponha que você queira que o Microsoft Copilot localize um email em que um colega elogia o trabalho de design de um fornecedor. O índice semântico inclui palavras próximas (por exemplo, eufórico, empolgado, impressionado) na pesquisa para ampliar a área de pesquisa e fornecer o melhor resultado. Todo esse trabalho ocorre nos bastidores, para aumentar a relevância dos resultados procurados por você com o Microsoft Copilot sem aumentar a complexidade.

A Pesquisa Semântica captura o significado semântico da sua consulta, como, por exemplo, o fato de que um texto semanticamente semelhante tenha valores numéricos semelhantes, para entender melhor a linguagem. Usando vetores, a Pesquisa Semântica pode entender as relações entre diferentes formatos de uma mesma palavra (por exemplo, tecnológico, tecnologia, tecnologias; EUA, E.U.A., Estados Unidos, Estados Unidos da América; cachorro, gato, animal de estimação) e capturar sinônimos naturalmente para expandir a quantidade de informações que podem ser pesquisadas. Essas melhorias ajudam a Pesquisa Semântica a entender a intenção de frases, trechos, documentos e reuniões. A Pesquisa Semântica também identifica ativos relacionados à sua consulta ou amostra de conteúdo e prepara os usuários para interagir com o Microsoft Copilot para Microsoft 365.

Como funciona o índice semântico

O índice semântico aprimora o Microsoft Copilot e os resultados de pesquisa nos aplicativos do Microsoft 365, no SharePoint Online e no Microsoft Teams. Faz isso criando dois índices para favorecer uma experiência de pesquisa aprimorada e a uma compreensão conceitual dos seus dados online, que são habilitados automaticamente pela Microsoft.

A indexação no nível do usuário cria um índice personalizado em um conjunto de dados de trabalho exclusivamente para você, tornando-o mais acessível para você usar com suas tarefas diárias. Isso inclui qualquer conteúdo baseado em texto que você criar ou com o qual interagir, como emails e documentos que mencionam você ou que você comenta ou compartilha. O índice no nível do locatário adiciona arquivos do SharePoint Online baseados em texto que podem ser acessados por duas ou mais pessoas na sua organização por meio da herança do site. No entanto, só exporá os resultados para um usuário se o usuário já tiver acesso ao conteúdo controlado pelo controle de acesso baseado em função. Além disso, o site do SharePoint Online precisa permanecer pesquisável.

A seção a seguir explica como habilitar cada índice, como o fluxo de dados no Copilot para Microsoft 365 usa o índice semântico, quais tipos de arquivo cada índice pode manipular e como cada índice lida com as atualizações.

Habilitação

Estamos nos estágios iniciais da implantação do índice semântico para todas as organizações que têm o Copilot para Microsoft 365 e uma licença do Microsoft 365 qualificada, sem qualquer envolvimento administrativo.

Recebemos feedback dos clientes no sentido de que o indicador de status de habilitação do índice semântico que existia anteriormente no Centro de Administração do Microsoft 365 era confuso. Para reduzir a confusão do cliente, removemos temporariamente o indicador até que possamos determinar uma melhor abordagem. Não houve nenhuma alteração no nosso compromisso de fornecer aos clientes uma experiência de pesquisa excepcional, e a Microsoft continuará a indexar as organizações automaticamente.

Fluxos de dados

O índice semântico interage com o Microsoft Graph para fornecer aos usuários um acesso a informações do índice no nível do usuário e no nível do locatário. O diagrama a seguir mostra como o fluxo de dados funciona para uma solicitação usando o Copilot para Microsoft 365.

Gráfico mostrando a relação entre o Copilot para Microsoft 365, os Aplicativos do Microsoft 365, o Microsoft Graph e o Modelo de Linguagem Grande.

Os prompts de usuários dos aplicativos do Microsoft 365 são enviados para o Copilot (1) e o Copilot acessa o Microsoft Graph e o índice semântico para o processamento (2). O Copilot envia o prompt modificado para o Modelo de Linguagem Grande (3), recebe a resposta do LLM (4) e, em seguida, acessa o Microsoft Graph e o índice semântico para o pós-processamento (5). Em seguida, o Copilot envia a resposta e o comando do aplicativo de volta para os aplicativos do Microsoft 365. Todas as solicitações são criptografadas por HTTPS e os dados do cliente permanecem criptografados quando inativos.

Tipos de conteúdo com suporte

O índice semântico dá suporte à indexação da caixa de correio de usuários e tipos de arquivos listados na tabela a seguir, sendo que o número de tipos de arquivo com suporte aumenta ao longo do tempo. Uma lista dos tipos de arquivo compatíveis com o índice no nível do usuário e o índice no nível do locatário está incluída na tabela.

Tipo de arquivo/conteúdo Nível do usuário Nível do locatário
Caixa de Correio do Usuário Com suporte Não aplicável
Caixa de Correio Delegada Sem suporte Não aplicável
Caixa de Correio Compartilhada Sem suporte Não aplicável
Dados de Caixa de Correio Arquivados Sem suporte Não aplicável
Dados do SharePoint Arquivados Sem suporte Sem suporte
Documentos do Word (doc/docx) Com suporte Com suporte
PowerPoint (pptx) Com suporte Com suporte
Arquivos PDF Com suporte Com suporte
Páginas da web (aspx) Com suporte Com suporte
Arquivos do OneNote (one) Com suporte Com suporte
Dados do Conector do Graph Não aplicável Com suporte

Atualizações do índice

Quando o índice semântico tiver concluído a indexação de um cliente pela primeira vez, os documentos criados por usuários passarão a ser indexados em tempo quase real na caixa de correio do usuário. Os documentos novos que são adicionados aos sites do SharePoint Online e podem ser acessados por dois ou mais usuários por meio da herança de site são indexados diariamente. Quando um documento indexado no nível de usuário e do locatário é atualizado, as alterações são indexadas imediatamente.

Administração

Fornecemos aos administradores atividades opcionais para preparar e gerenciar o índice semântico por meio do centro de administração do Microsoft 365. Nenhum envolvimento administrativo é necessário para habilitar o índice semântico, já que o serviço é habilitado automaticamente pela Microsoft. O índice semântico é uma melhoria da Pesquisa do Microsoft 365 e não pode ser desabilitado.

Os administradores podem optar por preparar e gerir o índice semântico ao rever as considerações para planear e implementar uma colaboração de ficheiros no SharePoint e partilhar permissões na experiência moderna do SharePoint. Os administradores podem optar por excluir arquivos do índice semântico revisando as considerações para excluir os dados com a Prevenção contra Perda de Dados (DLP) do Microsoft Purview. Se uma solução de DLP não estiver presente, os administradores poderão excluir sites do SharePoint Online a partir do índice no nível do locatário.

Como excluir sites do SharePoint Online

Existem ocasiões em que as organizações sem a Prevenção contra Perda de Dados do Microsoft Purview talvez queiram excluir um site do SharePoint Online da indexação de seus dados pela Pesquisa da Microsoft. Essas medidas só devem ser levadas em conta para dados confidenciais como folha de pagamento, RH ou informações financeiras. Para excluir um site do SharePoint Online, siga as etapas abaixo:

  1. Navegue até o site com as permissões de administrador apropriadas.
  2. Selecione Configurações e, em seguida, Informações do site no menu suspenso.
  3. Selecione Ver todas as configurações do site para exibir a página de Configurações do Site.
  4. Selecione Pesquisa e disponibilidade offline na categoria Pesquisa e selecione Não para a opção Permitir que esse site apareça nos resultados da pesquisa e excluí-lo tanto da Pesquisa da Microsoft quanto da pesquisa de índice semântico. Isso também pode ser feito com o PowerShell para vários sites.

Captura de tela mostrando as configurações para excluir sites do SharePoint Online.

A Pesquisa da Microsoft e o índice semântico dão suporte à exclusão do conteúdo do SharePoint Online apenas a partir do índice no nível do locatário. Não existe nenhuma opção para excluir os resultados somente da Pesquisa da Microsoft ou somente do índice semântico; as ações se aplicam aos dois recursos ao mesmo tempo.

Como configurar insights de Item

Na página de Pesquisa e Inteligência do centro de administração do Microsoft 365, os insights de Itens são habilitados por padrão. Desativar informações de pessoas ou itens reduz a experiência da Pesquisa da Microsoft e do índice semântico porque os resultados não incluirão pessoas relevantes que seriam derivadas de grupos de distribuição ou do organograma da organização.

  • Os insights de pessoas fornecem uma lista de pessoas relevantes para um usuário com base em seu trabalho colaborativo público no Microsoft 365. A colaboração pública inclui membros de um grupo de distribuição público e pessoas conectadas no organograma da organização.

  • Os insights de Item permitem recomendações para as pessoas na sua organização com base no trabalho colaborativo no Microsoft 365. Essas recomendações podem incluir, mas não se limitam a documentos ou outros tipos de conteúdo e aparecem nos cartões pessoais (contatos), no Delve, nos aplicativos do Microsoft 365, nos resultados do Microsoft Copilot e em outros locais.

Nem os insights de Item nem os insights de Pessoas abrangem recursos de personalização baseados nos dados do próprio usuário.

Como incorporar informações de terceiros

O índice semântico fornece uma maneira para as organizações trazerem seus dados organizacionais ou seu conteúdo fora do Microsoft 365 para o Copilot para Microsoft 365 e o ecossistema do Microsoft 365. Os conectores do Graph permitem a ingestão de fontes de dados externas, o que ajuda a enriquecer a experiência do Copilot para os usuários com resultados relevantes que aproveitam tanto os dados do Microsoft 365 quanto dados de terceiros. A Microsoft indexa todos os seus dados de conectores do Graph e, ao mesmo tempo, mantém os controles de acesso para o conteúdo. Isso expande os tipos de fontes de conteúdo que são pesquisáveis nos aplicativos de produtividade do seu Microsoft 365 e no ecossistema mais amplo da Microsoft e funciona melhor sempre que o conteúdo do conector for rico em textos. Os dados de terceiros podem ser hospedados localmente ou em nuvens públicas ou privadas, e essas informações são consumidas pelo Microsoft Graph, que pode ser ingerido no índice semântico para ajudar a fornecer à sua organização todo o contexto do Microsoft 365 e o conteúdo de terceiros da sua organização. Saiba mais sobre os requisitos de licenciamento do conector do Graph para o Microsoft 365 Enterprise e o Copilot para Microsoft 365 em Requisitos e preços de licenças.

Além disso, já estão disponíveis mais de 30 plugins e conectores do Graph, incluindo a pesquisa na web alimentada pelo Bing, Microsoft Dataverse, Jira, Trello, Mural, Confluence, Freshworks e Priority Matrix. Milhares de plugins adicionais de linha de negócios e de terceiros serão habilitados nos próximos meses, à medida que integrarmos as extensões de mensagens existentes do Teams e os conectores da Microsoft Power Platform ao Copilot para Microsoft 365. Esse amplo ecossistema de plugins para o Copilot para Microsoft 365 exposto nas ferramentas usadas todos os dias para o trabalho agrega um valor sem precedentes para os nossos clientes mútuos, à medida que transformamos a forma como o trabalho é feito em conjunto.

Privacidade, conformidade e segurança

O modelo de permissões dentro do locatário do Microsoft 365 pode ajudar a garantir que os dados não vazem involuntariamente entre usuários, grupos e locatários. O índice semântico apresenta somente os dados que cada indivíduo pode acessar usando os mesmos controles subjacentes para acesso aos dados usados em outros serviços do Microsoft 365. O índice semântico respeita os limites de acesso baseado na identidade do usuário de forma que o processo de fundamentação acesse somente o conteúdo que o usuário atual está autorizado a acessar. Para obter mais informações, confira a Política de privacidade e a documentação do serviço da Microsoft.

O Microsoft Copilot para Microsoft 365 está em conformidade com nossos compromissos existentes de privacidade, segurança e conformidade com os clientes comerciais do Microsoft 365, incluindo o Regulamento Geral sobre a Proteção de Dados (GDPR) e a Fronteira de Dados da União Europeia (UE). Os prompts, as respostas e os dados acessados por meio do Microsoft Graph não são usados para treinar LLMs fundacionais, incluindo aqueles utilizados pelo Microsoft Copilot para Microsoft 365. Para obter mais informações, confira Dados, Privacidade e Segurança do Copilot para Microsoft 365.

Armazenamento e processamento

Os dados gerados pelo índice semântico permanecem no locatário da empresa e estão em conformidade com suas políticas e processos de segurança, conformidade, identidade e privacidade. O índice semântico funciona somente com o conteúdo para o qual os usuários já têm permissão e não afeta as cotas de armazenamento.

As informações do índice no nível do usuário são armazenadas no local onde a caixa de correio do usuário está localizada e as informações de índice no nível do locatário são armazenadas em um contêiner de locatário do cliente isolado e protegido, localizado na região em que o site do SharePoint está localizado (região principal ou especificada pelo administrador do locatário de qualquer outra forma). Para os clientes dentro da Fronteira de Dados da União Europeia (EUDB), o índice é armazenado em um data center sediado na UE/EFTA. O processamento de outros clientes pode ocorrer na região de um locatário ou nos Estados Unidos. Para as organizações com estabelecimentos em diferentes regiões geográficas, todos os limites geográficos são respeitados. Os dados localizados em uma região são armazenados e processados na respectiva região. No momento da consulta, uma consulta federada é enviada para todas as regiões e mescla os resultados do índice semântico e da pesquisa de palavras-chave em uma única resposta para o usuário.

Suporte à Chave do Cliente (BYOK) no Microsoft Purview

O índice semântico fornece suporte de BYOK para empresas que habilitam o BYOK (Traga sua Própria Chave) no seu ambiente, tanto para o índice no nível de usuário quanto para o índice no nível do locatário. A Microsoft habilita automaticamente o índice semântico para os clientes com o BYOK habilitado sem qualquer envolvimento administrativo.

Proteção de informações

No contexto da pesquisa, não existem outras maneiras de excluir dados do índice semântico usando recursos de proteção de informações. O índice semântico herda as configurações de segurança e privacidade da Pesquisa da Microsoft e os dados trazidos dos conectores de terceiros receberão o mesmo armazenamento e as mesmas proteções que os outros dados do Microsoft 365. Para as organizações que estão investigando opções adicionais de proteção de informações, o Microsoft 365 fornece funcionalidades integradas nos aplicativos e produtos complementares do Microsoft 365 para ajudar os administradores a proteger os dados da organização por meio da minimização de dados e da redução do compartilhamento excessivo. As seções a seguir descrevem as opções disponíveis para as organizações apenas para fins de referência.

Minimização de dados

A minimização de dados reduz a quantidade de dados disponíveis para serem acessados dentro da sua organização. A retenção e a exclusão de conteúdo geralmente são necessárias para fins de conformidade e requisitos regulatórios, mas excluir um conteúdo que não tem mais valor comercial também ajuda a gerenciar os riscos e a responsabilidade civil. O Gerenciamento do Ciclo de Vida de Dados do Microsoft Purview, que é licenciado separadamente, pode ser usado para excluir um conteúdo que não seja mais necessário, com políticas de retenção para o gerenciamento em larga escala e rótulos de retenção para as exceções e um controle granular.

Redução do compartilhamento excessivo

Faz tempo que as organizações são capazes de adotar medidas para reduzir o compartilhamento excessivo no Microsoft 365 usando controles existentes no centro de administração do Microsoft 365 e no SharePoint Online. É importante observar que o índice semântico não altera as permissões de acesso ao conteúdo e não altera os princípios de como os usuários devem compartilhar informações com seus colegas. Por exemplo, o índice semântico não faz com que o conteúdo compartilhado com um link que funciona para todas as pessoas na minha organização se torne parte do índice no nível do locatário. Somente os usuários que selecionarem um link ao qual têm acesso terão as informações adicionadas ao respectivo índice de usuário. Ao explorar as opções de proteção de informações, é recomendável que as organizações levem em conta o seguinte:

  • Planejar a colaboração segura de arquivos: leia Planejar e implantar uma colaboração de arquivos para entender melhor as boas práticas para operar um ambiente de colaboração de arquivos seguro e produtivo para seus usuários.

  • Tamanho correto do acesso do usuário aos dados para reduzir a lista: reduza o excesso de compartilhamento herdando listas de exclusão dos sites do SharePoint Online e executando verificações de controle de acesso em tempo real a dados que estão presentes no índice semântico. As organizações podem pensar em usar o Complemento de Gerenciamento Avançado do SharePoint no Syntex para gerenciar e controlar essas permissões.

  • Usar rótulos de confidencialidade: uma outra maneira é rotular os dados com os rótulos de confidencialidade da Proteção de Informações do Microsoft Purview. Os rótulos que aplicam criptografia utilizam direitos de uso para fornecer uma camada extra de proteção e também estão incluídos no refinamento de pesquisas (ou seja, têm suporte para filtragem e regras do lado do aplicativo usadas para restrições de acesso e marcação visual).

  • Limite de acesso: a Prevenção contra Perda de Dados do Microsoft Purview está disponível no Microsoft 365 E5 e pode ser usada para limitar retroativa e temporariamente o acesso a documentos que foram reportados como apresentando compartilhamento em excesso. Se você não for cliente do Microsoft 365 E5, sua organização pode usar a avaliação das soluções do Microsoft Purview de 90 dias para explorar como as capacidades adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de conformidade e de segurança de dados.

Os clientes interessados em explorar como implantar soluções avançadas de proteção de informações, devem ler o artigo a seguir, que explica como implantar uma solução de proteção de informações com o Microsoft Purview. Para obter mais informações sobre como o Microsoft Purview pode ajudar você a reforçar seus requisitos de conformidade e segurança de dados para o Copilot para Microsoft 365, confira Proteger e gerenciar as interações entre o Copilot para Microsoft 365 e o Microsoft Purview.

Recursos adicionais

O Microsoft 365, o Microsoft Graph e o índice semântico permitem uma expressividade sem precedentes para a pesquisa, o chat e copilotos que aproveitam os dados do Microsoft 365. Essa expressividade ajuda a expor os dados de fundamentação certos para você aproveitar ao máximo os dados da organização com o Microsoft 365 e o Copilot para Microsoft 365.

Para saber mais sobre o Copilot para Microsoft 365, confira esses recursos: