Kom igång med Python Enterprise-chattexemplet med HJÄLP av RAG

Artikel
11/21/2023

Den här artikeln visar hur du distribuerar och kör exemplet på företagschattappen för Python. Det här exemplet implementerar en chattapp med Python, Azure OpenAI Service och Retrieveal Augmented Generation (RAG) i Azure AI Search för att få svar om medarbetarförmåner på ett fiktivt företag. Appen är seedad med PDF-filer inklusive den anställdas handbok, ett förmånsdokument och en lista över företagsroller och förväntningar.

Demonstrationsvideo

Börja nu

Genom att följa anvisningarna i den här artikeln gör du följande:

Distribuera en chattapp till Azure.
Få svar om medarbetarförmåner.
Ändra inställningarna för att ändra beteendet för svar.

När du har slutfört den här proceduren kan du börja ändra det nya projektet med din anpassade kod.

Den här artikeln är en del av en samling artiklar som visar hur du skapar en chattapp med Hjälp av Azure OpenAI Service och Azure AI Search.

Andra artiklar i samlingen är:

Arkitekturöversikt

En enkel arkitektur för chattappen visas i följande diagram:

Diagram som visar arkitektur från klient till serverdelsapp.

Viktiga komponenter i arkitekturen är:

Ett webbprogram som är värd för den interaktiva chattupplevelsen.
En Azure AI Search-resurs för att få svar från dina egna data.
En Azure OpenAI-tjänst som ska tillhandahålla:
- Nyckelord för att förbättra sökningen över dina egna data.
- Svar från OpenAI-modellen.
- Inbäddningar från ada-modellen

Kostnad

De flesta resurser i den här arkitekturen använder en prisnivå för grundläggande eller förbrukning. Förbrukningspriser baseras på användning, vilket innebär att du bara betalar för det du använder. För att slutföra den här artikeln kommer det att finnas en avgift men den kommer att vara minimal. När du är klar med artikeln kan du ta bort resurserna för att sluta debiteras.

Läs mer om kostnaden i exempelrepo.

Förutsättningar

En utvecklingscontainermiljö är tillgänglig med alla beroenden som krävs för att slutföra den här artikeln. Du kan köra utvecklingscontainern i GitHub Codespaces (i en webbläsare) eller lokalt med hjälp av Visual Studio Code.

Om du vill använda den här artikeln behöver du följande krav:

Kodområden (rekommenderas)
Visual Studio Code

En Azure-prenumeration – Skapa en kostnadsfritt
Azure-kontobehörigheter – Ditt Azure-konto måste ha behörigheten Microsoft.Authorization/roleAssignments/write, till exempel administratör för användaråtkomst eller ägare.
Åtkomst beviljad till Azure OpenAI i den önskade Azure-prenumerationen. För närvarande måste man ansöka om att få åtkomst till den här tjänsten. Du kan ansöka om åtkomst till Azure OpenAI genom att fylla i formuläret på https://aka.ms/oai/access. Öppna ett problem på den här lagringsplatsen för att kontakta oss om du har ett problem.
GitHub-konto

Öppna utvecklingsmiljön

Börja nu med en utvecklingsmiljö som har alla beroenden installerade för att slutföra den här artikeln.

GitHub Codespaces (rekommenderas)
Visual Studio Code

GitHub Codespaces kör en utvecklingscontainer som hanteras av GitHub med Visual Studio Code för webben som användargränssnitt. För den enklaste utvecklingsmiljön använder du GitHub Codespaces så att du har rätt utvecklarverktyg och beroenden förinstallerade för att slutföra den här artikeln.

Viktigt!

Alla GitHub-konton kan använda Codespaces i upp till 60 timmar kostnadsfritt varje månad med 2 kärninstanser. Mer information finns i GitHub Codespaces månadsvis inkluderade lagrings- och kärntimmar.

Starta processen för att skapa ett nytt GitHub Codespace på grenen main av Azure-Samples/azure-search-openai-demo GitHub-lagringsplatsen.
Högerklicka på följande knapp och välj Öppna länk i nya fönster för att ha både utvecklingsmiljön och dokumentationen tillgänglig samtidigt.

Öppna det här projektet i GitHub Codespaces
På sidan Skapa kodområde granskar du konfigurationsinställningarna för kodområdet och väljer sedan Skapa nytt kodområde
Vänta tills kodområdet har startats. Den här startprocessen kan ta några minuter.
Logga in på Azure med Azure Developer CLI i terminalen längst ned på skärmen.
```
azd auth login
```
Kopiera koden från terminalen och klistra sedan in den i en webbläsare. Följ anvisningarna för att autentisera med ditt Azure-konto.
De återstående uppgifterna i den här artikeln sker i samband med den här utvecklingscontainern.

Dev Containers-tillägget för Visual Studio Code kräver att Docker installeras på den lokala datorn. Tillägget är värd för utvecklingscontainern lokalt med Docker-värden med rätt utvecklarverktyg och beroenden förinstallerade för att slutföra den här artikeln.

Öppna Visual Studio Code i kontexten för en tom katalog.
Kontrollera att tillägget Dev Containers är installerat i Visual Studio Code.
Öppna en ny terminal i redigeraren.

Dricks

Du kan använda huvudmenyn för att navigera till menyalternativet Terminal och sedan välja alternativet Ny terminal .
Logga in på Azure med Azure Developer CLI.
```
azd auth login
```
När du uppmanas till det kopierar du koden från terminalen och klistrar sedan in den i en webbläsare. Följ anvisningarna för att autentisera med ditt Azure-konto.
Skapa en mapp och initiera den för att använda exempelprojektet med Azure Developer CLI:
```
azd init -t azure-search-openai-demo
```
Du behöver inte klona den här lagringsplatsen.
Öppna kommandopaletten, sök efter Dev Containers-kommandona och välj sedan Dev Containers: Reopen in Container (Dev Containers: Reopen in Container).

Dricks

Visual Studio Code kan automatiskt uppmana dig att öppna den befintliga mappen i en utvecklingscontainer. Detta är funktionellt likvärdigt med att använda kommandopaletten för att öppna den aktuella arbetsytan igen i en container.
Öppna terminalfönstret igen (Ctrl + `) och låt det vara öppet.
De återstående övningarna i det här projektet sker i samband med den här utvecklingscontainern.

Distribuera och köra

Exempellagringsplatsen innehåller alla kod- och konfigurationsfiler som du behöver för att distribuera en chattapp till Azure. Följande steg beskriver hur du distribuerar exemplet till Azure.

Distribuera chattapp till Azure

Viktigt!

Azure-resurser som skapas i det här avsnittet medför omedelbara kostnader, främst från Azure AI Search-resursen. Dessa resurser kan medföra kostnader även om du avbryter kommandot innan det körs fullständigt.

Kör följande Azure Developer CLI-kommando för att etablera Azure-resurserna och distribuera källkoden:
```
azd up
```
När du uppmanas att ange ett miljönamn ska du hålla det kort och gemener. Exempel: myenv Den används som en del av resursgruppens namn.
När du uppmanas till det väljer du en prenumeration för att skapa resurserna i.
När du uppmanas att välja en plats första gången väljer du en plats nära dig. Den här platsen används för de flesta resurser, inklusive värdtjänster.
Om du uppmanas att ange en plats för OpenAI-modellen eller för dokumentinformationsresursen väljer du den plats som är närmast dig. Om samma plats är tillgänglig som din första plats väljer du det.
Vänta tills appen har distribuerats. Det kan ta 5–10 minuter för distributionen att slutföras.
När programmet har distribuerats visas en URL i terminalen.
Välj den URL:en som är märkt (✓) Done: Deploying service webapp för att öppna chattprogrammet i en webbläsare.

Använda chattappen för att få svar från PDF-filer

Chattappen är förinstallerad med information om medarbetarnas förmåner från PDF-filer. Du kan använda chattappen för att ställa frågor om fördelarna. Följande steg beskriver hur du använder chattappen.

I webbläsaren väljer eller anger du Vad händer i en prestandagranskning? i chatttextrutan.
Välj en källhänvisning i svaret.

I det högra fönstret använder du flikarna för att förstå hur svaret genererades.

Tabb	beskrivning
Tankeprocess	Det här är ett skript för interaktionerna i chatten. Du kan visa systemprompten (`content`) och användarfrågan (`content`).
Stöd för innehåll	Detta inkluderar information för att besvara din fråga och källmaterialet. Antalet källmaterialciteringar anges i inställningarna för utvecklare. Standardvärdet är 3.
Hänvisning	Då visas den ursprungliga sidan som innehåller citatet.

När du är klar väljer du den markerade fliken igen för att stänga fönstret.

Använda inställningar för chattappar för att ändra beteendet för svar

Informationen i chatten bestäms av OpenAI-modellen och de inställningar som används för att interagera med modellen.

Skärmbild av inställningar för chattutvecklare.

Inställning	beskrivning
Åsidosätt promptmall	Det här är uppmaningen som används för att generera svaret.
Temperatur	Den temperatur som används för det sista API-anropet för slutförande av chatt, ett tal mellan 0 och 1 som styr modellens "kreativitet".
Minsta sökpoäng	Minimipoängen för sökresultaten som används för att generera svaret. Intervallet beror på vilket sökläge som används.
Minsta rerankerpoäng	Minimipoängen från den semantiska rangordningen för sökresultaten som används för att generera svaret. Sträcker sig från 0-4.
Hämta så många sökresultat	Det här är antalet sökresultat som används för att generera svaret. Du kan se dessa källor som returneras i flikarna Tankeprocess och Stöd för innehåll i källhänvisning.
Exkludera kategori	Det här är kategorin av dokument som undantas från sökresultaten.
Använda semantisk ranker för hämtning	Det här är en funktion i Azure AI Search som använder maskininlärning för att förbättra sökresultatens relevans.
Använda frågekontextsammanfattningar i stället för hela dokument	När både `Use semantic ranker` och `Use query-contextual summaries` kontrolleras använder LLM bildtext som extraherats från nyckelpassagen, i stället för alla passager, i de högst rankade dokumenten.
Föreslå uppföljningsfrågor	Låt chattappen föreslå uppföljningsfrågor baserat på svaret.
Hämtningsläge	Vektorer + Text innebär att sökresultaten baseras på texten i dokumenten och inbäddningarna av dokumenten. Vektorer innebär att sökresultaten baseras på inbäddning av dokumenten. Text innebär att sökresultaten baseras på texten i dokumenten.
Svar om att streamchatten har slutförts	Stream-svar i stället för att vänta tills det fullständiga svaret är tillgängligt för ett svar.

Följande steg beskriver hur du ändrar inställningarna.

I webbläsaren väljer du fliken Utvecklare Inställningar.

Markera kryssrutan Föreslå uppföljningsfrågor och ställ samma fråga igen.

What happens in a performance review?

Chatten returnerade föreslagna uppföljningsfrågor, till exempel följande:

1. What is the frequency of performance reviews?
2. How can employees prepare for a performance review?
3. Can employees dispute the feedback received during the performance review?

På fliken Inställningar avmarkerar du Använd semantisk ranker för hämtning.
Ställ samma fråga igen?
```
What happens in a performance review?
```
Vad är skillnaden i svaren?

Med Semantic Ranker: Under en prestationsgranskning på Contoso Electronics får anställda möjlighet att diskutera sina framgångar och utmaningar på arbetsplatsen (1). Granskningen kommer att ge positiv och konstruktiv feedback för att hjälpa anställda att utveckla och växa i sina roller (1). Medarbetaren får en skriftlig sammanfattning av prestationsgranskningen, som kommer att innehålla en klassificering av deras prestanda, feedback och mål och mål för det kommande året (1). Resultatgranskningen är en dubbelriktad dialog mellan chefer och anställda (1).

Utan den semantiska rankaren: Under en prestationsgranskning på Contoso Electronics har anställda möjlighet att diskutera sina framgångar och utmaningar på arbetsplatsen. Positiv och konstruktiv feedback ges för att hjälpa anställda att utvecklas och växa i sina roller. En skriftlig sammanfattning av prestandagranskningen ges, inklusive ett omdöme om prestanda, feedback och mål för det kommande året. Granskningen är en dubbelriktad dialog mellan chefer och anställda (1).

Rensa resurser

Rensa Azure-resurser

De Azure-resurser som skapas i den här artikeln faktureras till din Azure-prenumeration. Om du inte förväntar dig att behöva dessa resurser i framtiden tar du bort dem för att undvika att debiteras mer.

Kör följande Azure Developer CLI-kommando för att ta bort Azure-resurserna och ta bort källkoden:

azd down --purge --force

Växlarna tillhandahåller:

purge: Borttagna resurser rensas omedelbart. På så sätt kan du återanvända Azure OpenAI TPM.
force: Borttagningen sker siliently, utan att användarens medgivande krävs.

Om du tar bort GitHub Codespaces-miljön kan du maximera mängden kostnadsfria timmar per kärna som du får för ditt konto.

Viktigt!

Mer information om ditt GitHub-kontos rättigheter finns i GitHub Codespaces månadsvis inkluderade lagrings- och kärntimmar.

Logga in på GitHub Codespaces-instrumentpanelen (https://github.com/codespaces).
Leta upp de codespaces som körs från Azure-Samples/azure-search-openai-demo GitHub-lagringsplatsen.
Öppna snabbmenyn för kodområdet och välj sedan Ta bort.

Få hjälp

Den här exempellagringsplatsen innehåller felsökningsinformation.

Om problemet inte åtgärdas loggar du problemet till lagringsplatsens problem.

Kom igång med Python Enterprise-chattexemplet med HJÄLP av RAG

Arkitekturöversikt

Kostnad

Förutsättningar

Öppna utvecklingsmiljön

Distribuera och köra

Distribuera chattapp till Azure

Använda chattappen för att få svar från PDF-filer

Använda inställningar för chattappar för att ändra beteendet för svar

Rensa resurser

Rensa Azure-resurser

Rensa GitHub Codespaces

Få hjälp

Nästa steg

Feedback

Feedback

Ytterligare resurser