Utveckla U-SQL med python, R och C# för Azure Data Lake Analytics i Visual Studio Code
Lär dig hur du använder Visual Studio Code (VSCode) för att skriva python-, R-och C#-kod bakom med U-SQL och skicka jobb till Azure Data Lake-tjänsten. Mer information om Azure Data Lake verktyg för VSCode finns i använda Azure Data Lake Tools för Visual Studio Code.
Innan du skriver kod bakom anpassad kod måste du öppna en mapp eller en arbets yta i VSCode.
Krav för python och R
Registrera python-och R Extensions-sammansättningar för ditt ADL-konto.
Öppna ditt konto i portalen.
- Välj Översikt.
- Klicka på exempel skript.
Klicka på Mer.
Välj Installera U-SQL-tillägg.
Bekräftelse meddelande visas efter att U-SQL-tilläggen har installerats.

Anteckning
För bästa möjliga upplevelse av python-och R-språktjänsten installerar du VSCode python och R Extension.
Utveckla python-fil
Klicka på den nya filen i din arbets yta.
Skriv koden i U-SQL. Följande är ett kod exempel.
REFERENCE ASSEMBLY [ExtPython]; @t = SELECT * FROM (VALUES ("D1","T1","A1","@foo Hello World @bar"), ("D2","T2","A2","@baz Hello World @beer") ) AS D( date, time, author, tweet ); @m = REDUCE @t ON date PRODUCE date string, mentions string USING new Extension.Python.Reducer("pythonSample.usql.py", pyVersion : "3.5.1"); OUTPUT @m TO "/tweetmentions.csv" USING Outputters.Csv();Högerklicka på en skript fil och välj sedan ADL: generera python-kod bakom fil.
Xxx.usql.py -filen genereras i arbetsmappen. Skriv koden i python-filen. Följande är ett kod exempel.
def get_mentions(tweet): return ';'.join( ( w[1:] for w in tweet.split() if w[0]=='@' ) ) def usqlml_main(df): del df['time'] del df['author'] df['mentions'] = df.tweet.apply(get_mentions) del df['tweet'] return dfHögerklicka på USQL -filen, du kan klicka på kompilera skript eller Skicka jobb till jobbet som körs.
Utveckla R-fil
Klicka på den nya filen i din arbets yta.
Skriv koden i U-SQL-filen. Följande är ett kod exempel.
DEPLOY RESOURCE @"/usqlext/samples/R/my_model_LM_Iris.rda"; DECLARE @IrisData string = @"/usqlext/samples/R/iris.csv"; DECLARE @OutputFilePredictions string = @"/my/R/Output/LMPredictionsIris.txt"; DECLARE @PartitionCount int = 10; @InputData = EXTRACT SepalLength double, SepalWidth double, PetalLength double, PetalWidth double, Species string FROM @IrisData USING Extractors.Csv(); @ExtendedData = SELECT Extension.R.RandomNumberGenerator.GetRandomNumber(@PartitionCount) AS Par, SepalLength, SepalWidth, PetalLength, PetalWidth FROM @InputData; // Predict Species @RScriptOutput = REDUCE @ExtendedData ON Par PRODUCE Par, fit double, lwr double, upr double READONLY Par USING new Extension.R.Reducer(scriptFile : "RClusterRun.usql.R", rReturnType : "dataframe", stringsAsFactors : false); OUTPUT @RScriptOutput TO @OutputFilePredictions USING Outputters.Tsv();Högerklicka på filen USQL och välj sedan ADL: generera R-kod bakom fil.
Filen xxx. usql. r skapas i arbetsmappen. Skriv koden i R-filen. Följande är ett kod exempel.
load("my_model_LM_Iris.rda") outputToUSQL=data.frame(predict(lm.fit, inputFromUSQL, interval="confidence"))Högerklicka på USQL -filen, du kan klicka på kompilera skript eller Skicka jobb till jobbet som körs.
Utveckla C#-fil
En fil med bakomliggande kod är en C#-fil som associeras med ett enda U-SQL-skript. Du kan definiera ett skript som är avsett för UDO, UDA, UDT och UDF i filen bakomliggande kod. UDO, UDA, UDT och UDF kan användas direkt i skriptet utan att först registrera sammansättningen. Filen bakomliggande kod placeras i samma mapp som dess peering U-SQL-skriptfil. Om skriptet heter xxx. usql, namnges bakomliggande kod som xxx. usql. cs. Om du manuellt tar bort filen med bakomliggande kod är funktionen bakomliggande kod inaktive rad för det associerade U-SQL-skriptet. Mer information om hur du skriver kund kod för U-SQL-skript finns i skriva och använda anpassad kod i U-SQL: User-Defined Functions.
Klicka på den nya filen i din arbets yta.
Skriv koden i U-SQL-filen. Följande är ett kod exempel.
@a = EXTRACT Iid int, Starts DateTime, Region string, Query string, DwellTime int, Results string, ClickedUrls string FROM @"/Samples/Data/SearchLog.tsv" USING Extractors.Tsv(); @d = SELECT DISTINCT Region FROM @a; @d1 = PROCESS @d PRODUCE Region string, Mkt string USING new USQLApplication_codebehind.MyProcessor(); OUTPUT @d1 TO @"/output/SearchLogtest.txt" USING Outputters.Tsv();Högerklicka på filen USQL och välj sedan ADL: generera CS-kod bakom fil.
Filen xxx. usql. cs skapas i arbetsmappen. Skriv koden i CS-fil. Följande är ett kod exempel.
namespace USQLApplication_codebehind { [SqlUserDefinedProcessor] public class MyProcessor : IProcessor { public override IRow Process(IRow input, IUpdatableRow output) { output.Set(0, input.Get<string>(0)); output.Set(1, input.Get<string>(0)); return output.AsReadOnly(); } } }Högerklicka på USQL -filen, du kan klicka på kompilera skript eller Skicka jobb till jobbet som körs.
Nästa steg
- Använda Azure Data Lake Tools för Visual Studio Code
- U-SQL lokal körning och lokal fel sökning med Visual Studio Code
- Kom igång med Data Lake Analytics med PowerShell
- Kom igång med Data Lake Analytics med hjälp av Azure Portal
- Använd Data Lake verktyg för Visual Studio för att utveckla U-SQL-program
- Använda Data Lake Analytics-katalogen (U-SQL)