UTF32Encoding.GetBytes Metoda
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Kóduje sadu znaků do posloupnosti bajtů.
Přetížení
GetBytes(Char*, Int32, Byte*, Int32) |
Zakóduje sadu znaků začínající na zadaném ukazateli znaků do posloupnosti bajtů, které jsou uložené od zadaného bajtového ukazatele. |
GetBytes(Char[], Int32, Int32, Byte[], Int32) |
Zakóduje sadu znaků ze zadaného pole znaků do zadaného bajtového pole. |
GetBytes(String, Int32, Int32, Byte[], Int32) |
Zakóduje sadu znaků ze zadaného String pole do zadaného bajtového pole. |
GetBytes(Char*, Int32, Byte*, Int32)
Důležité
Toto rozhraní API neodpovídá specifikaci CLS.
Zakóduje sadu znaků začínající na zadaném ukazateli znaků do posloupnosti bajtů, které jsou uložené od zadaného bajtového ukazatele.
public:
override int GetBytes(char* chars, int charCount, System::Byte* bytes, int byteCount);
[System.CLSCompliant(false)]
[System.Security.SecurityCritical]
public override int GetBytes (char* chars, int charCount, byte* bytes, int byteCount);
[System.CLSCompliant(false)]
public override int GetBytes (char* chars, int charCount, byte* bytes, int byteCount);
[<System.CLSCompliant(false)>]
[<System.Security.SecurityCritical>]
override this.GetBytes : nativeptr<char> * int * nativeptr<byte> * int -> int
[<System.CLSCompliant(false)>]
override this.GetBytes : nativeptr<char> * int * nativeptr<byte> * int -> int
Parametry
- chars
- Char*
Ukazatel na první znak, který se má kódovat.
- charCount
- Int32
Počet znaků, které se mají kódovat.
- bytes
- Byte*
Ukazatel na umístění, ve kterém chcete začít psát výslednou sekvenci bajtů.
- byteCount
- Int32
Maximální počet bajtů k zápisu
Návraty
Skutečný počet bajtů napsaných v umístění označeném parametrem bytes
.
- Atributy
Výjimky
charCount
nebo byteCount
je menší než nula.
Detekce chyb je povolená a chars
obsahuje neplatnou posloupnost znaků.
-nebo-
byteCount
je menší než výsledný počet bajtů.
Došlo k náhradnímu obnovení (další informace najdete v tématu Kódování znaků v .NET). -a- EncoderFallback je nastavena na EncoderExceptionFallbackhodnotu .
Poznámky
Pokud chcete vypočítat přesnou velikost pole potřebnou GetBytes k uložení výsledných bajtů, zavoláte metodu GetByteCount . Pokud chcete vypočítat maximální velikost pole, zavoláte metodu GetMaxByteCount . Metoda GetByteCount obecně přiděluje méně paměti, zatímco GetMaxByteCount metoda obvykle provádí rychleji.
Při detekci chyb způsobí neplatná sekvence tuto metodu ArgumentExceptionvyvolá . Bez detekce chyb jsou neplatné sekvence ignorovány a vyvolá se žádná výjimka.
Data, která se mají převést, například data načtená ze streamu, můžou být dostupná jenom v sekvenčních blocích. V tomto případě nebo pokud je množství dat tak velké, že je potřeba je rozdělit na menší bloky, aplikace používá Decoder metodu nebo metodu nebo Encoder GetDecoder metodu GetEncoder .
Důležité
Chcete-li zajistit správné dekódování zakódovaných bajtů při jejich uložení jako souboru nebo jako streamu, můžete předponu datového proudu kódovaných bajtů předponou preambule. Vložení preambule na začátek bajtového datového proudu (například na začátku řady bajtů, které se mají zapsat do souboru) je zodpovědností vývojáře. Metoda GetBytes nepředkládá preambuli na začátek sekvence zakódovaných bajtů.
Viz také
Platí pro
GetBytes(Char[], Int32, Int32, Byte[], Int32)
Zakóduje sadu znaků ze zadaného pole znaků do zadaného bajtového pole.
public:
override int GetBytes(cli::array <char> ^ chars, int charIndex, int charCount, cli::array <System::Byte> ^ bytes, int byteIndex);
public override int GetBytes (char[] chars, int charIndex, int charCount, byte[] bytes, int byteIndex);
override this.GetBytes : char[] * int * int * byte[] * int -> int
Public Overrides Function GetBytes (chars As Char(), charIndex As Integer, charCount As Integer, bytes As Byte(), byteIndex As Integer) As Integer
Parametry
- chars
- Char[]
Pole znaků obsahující sadu znaků, které se mají kódovat.
- charIndex
- Int32
Index prvního znaku, který se má kódovat.
- charCount
- Int32
Počet znaků, které se mají kódovat.
- bytes
- Byte[]
Bajtové pole, které bude obsahovat výslednou posloupnost bajtů.
- byteIndex
- Int32
Index, na kterém začnete psát výslednou sekvenci bajtů.
Návraty
Skutečný počet bajtů zapsaných do bytes
.
Výjimky
charIndex
nebo charCount
byteIndex
je menší než nula.
-nebo-
charIndex
a charCount
neoznamujte platnou oblast v chars
.
-nebo-
byteIndex
není platný index v bytes
.
Detekce chyb je povolená a chars
obsahuje neplatnou posloupnost znaků.
-nebo-
bytes
nemá dostatečnou kapacitu od byteIndex
konce pole, aby vyhovovala výsledným bajtům.
Došlo k náhradnímu obnovení (další informace najdete v tématu Kódování znaků v .NET). -a- EncoderFallback je nastavena na EncoderExceptionFallbackhodnotu .
Příklady
Následující příklad určuje počet bajtů potřebných k kódování tří znaků z pole znaků a poté kóduje znaky a zobrazí výsledné bajty.
using namespace System;
using namespace System::Text;
void PrintCountsAndBytes( array<Char>^chars, int index, int count, Encoding^ enc );
void PrintHexBytes( array<Byte>^bytes );
int main()
{
// The characters to encode:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
// a high-surrogate value (U+D8FF)
// a low-surrogate value (U+DCFF)
array<Char>^myChars = gcnew array<Char>(7){
L'z',L'a',L'\u0306',L'\u01FD',L'\u03B2',L'\xD8FF',L'\xDCFF'
};
// Create instances of different encodings.
UTF7Encoding^ u7 = gcnew UTF7Encoding;
UTF8Encoding^ u8Nobom = gcnew UTF8Encoding( false,true );
UTF8Encoding^ u8Bom = gcnew UTF8Encoding( true,true );
UTF32Encoding ^ u32Nobom = gcnew UTF32Encoding( false,false,true );
UTF32Encoding ^ u32Bom = gcnew UTF32Encoding( false,true,true );
// Encode three characters starting at index 4 and print out the counts and the resulting bytes.
PrintCountsAndBytes( myChars, 4, 3, u7 );
PrintCountsAndBytes( myChars, 4, 3, u8Nobom );
PrintCountsAndBytes( myChars, 4, 3, u8Bom );
PrintCountsAndBytes( myChars, 4, 3, u32Nobom );
PrintCountsAndBytes( myChars, 4, 3, u32Bom );
}
void PrintCountsAndBytes( array<Char>^chars, int index, int count, Encoding^ enc )
{
// Display the name of the encoding used.
Console::Write( "{0,-25} :", enc );
// Display the exact byte count.
int iBC = enc->GetByteCount( chars, index, count );
Console::Write( " {0,-3}", iBC );
// Display the maximum byte count.
int iMBC = enc->GetMaxByteCount( count );
Console::Write( " {0,-3} :", iMBC );
// Get the byte order mark, if any.
array<Byte>^preamble = enc->GetPreamble();
// Combine the preamble and the encoded bytes.
array<Byte>^bytes = gcnew array<Byte>(preamble->Length + iBC);
Array::Copy( preamble, bytes, preamble->Length );
enc->GetBytes( chars, index, count, bytes, preamble->Length );
// Display all the encoded bytes.
PrintHexBytes( bytes );
}
void PrintHexBytes( array<Byte>^bytes )
{
if ( (bytes == nullptr) || (bytes->Length == 0) )
Console::WriteLine( "<none>" );
else
{
for ( int i = 0; i < bytes->Length; i++ )
Console::Write( "{0:X2} ", bytes[ i ] );
Console::WriteLine();
}
}
/*
This code produces the following output.
System.Text.UTF7Encoding : 10 11 :2B 41 37 4C 59 2F 39 7A 2F 2D
System.Text.UTF8Encoding : 6 12 :CE B2 F1 8F B3 BF
System.Text.UTF8Encoding : 6 12 :EF BB BF CE B2 F1 8F B3 BF
System.Text.UTF32Encoding : 8 12 :B2 03 00 00 FF FC 04 00
System.Text.UTF32Encoding : 8 12 :FF FE 00 00 B2 03 00 00 FF FC 04 00
*/
using System;
using System.Text;
public class SamplesUTF32Encoding {
public static void Main() {
// The characters to encode:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
// a high-surrogate value (U+D8FF)
// a low-surrogate value (U+DCFF)
char[] myChars = new char[7] { 'z', 'a', '\u0306', '\u01FD', '\u03B2', '\uD8FF', '\uDCFF' };
// Create instances of different encodings.
UTF7Encoding u7 = new UTF7Encoding();
UTF8Encoding u8Nobom = new UTF8Encoding( false, true );
UTF8Encoding u8Bom = new UTF8Encoding( true, true );
UTF32Encoding u32Nobom = new UTF32Encoding( false, false, true );
UTF32Encoding u32Bom = new UTF32Encoding( false, true, true );
// Encode three characters starting at index 4 and print out the counts and the resulting bytes.
PrintCountsAndBytes( myChars, 4, 3, u7 );
PrintCountsAndBytes( myChars, 4, 3, u8Nobom );
PrintCountsAndBytes( myChars, 4, 3, u8Bom );
PrintCountsAndBytes( myChars, 4, 3, u32Nobom );
PrintCountsAndBytes( myChars, 4, 3, u32Bom );
}
public static void PrintCountsAndBytes( char[] chars, int index, int count, Encoding enc ) {
// Display the name of the encoding used.
Console.Write( "{0,-25} :", enc.ToString() );
// Display the exact byte count.
int iBC = enc.GetByteCount( chars, index, count );
Console.Write( " {0,-3}", iBC );
// Display the maximum byte count.
int iMBC = enc.GetMaxByteCount( count );
Console.Write( " {0,-3} :", iMBC );
// Get the byte order mark, if any.
byte[] preamble = enc.GetPreamble();
// Combine the preamble and the encoded bytes.
byte[] bytes = new byte[preamble.Length + iBC];
Array.Copy( preamble, bytes, preamble.Length );
enc.GetBytes( chars, index, count, bytes, preamble.Length );
// Display all the encoded bytes.
PrintHexBytes( bytes );
}
public static void PrintHexBytes( byte[] bytes ) {
if (( bytes == null ) || ( bytes.Length == 0 ))
{
Console.WriteLine( "<none>" );
}
else {
for ( int i = 0; i < bytes.Length; i++ )
Console.Write( "{0:X2} ", bytes[i] );
Console.WriteLine();
}
}
}
/*
This code produces the following output.
System.Text.UTF7Encoding : 10 11 :2B 41 37 4C 59 2F 39 7A 2F 2D
System.Text.UTF8Encoding : 6 12 :CE B2 F1 8F B3 BF
System.Text.UTF8Encoding : 6 12 :EF BB BF CE B2 F1 8F B3 BF
System.Text.UTF32Encoding : 8 12 :B2 03 00 00 FF FC 04 00
System.Text.UTF32Encoding : 8 12 :FF FE 00 00 B2 03 00 00 FF FC 04 00
*/
Imports System.Text
Public Class SamplesUTF32Encoding
Public Shared Sub Main()
' The characters to encode:
' Latin Small Letter Z (U+007A)
' Latin Small Letter A (U+0061)
' Combining Breve (U+0306)
' Latin Small Letter AE With Acute (U+01FD)
' Greek Small Letter Beta (U+03B2)
' a high-surrogate value (U+D8FF)
' a low-surrogate value (U+DCFF)
Dim myChars() As Char = {"z"c, "a"c, ChrW(&H0306), ChrW(&H01FD), ChrW(&H03B2), ChrW(&HD8FF), ChrW(&HDCFF)}
' Create instances of different encodings.
Dim u7 As New UTF7Encoding()
Dim u8Nobom As New UTF8Encoding(False, True)
Dim u8Bom As New UTF8Encoding(True, True)
Dim u32Nobom As New UTF32Encoding(False, False, True)
Dim u32Bom As New UTF32Encoding(False, True, True)
' Encode three characters starting at index 4 and print out the counts and the resulting bytes.
PrintCountsAndBytes(myChars, 4, 3, u7)
PrintCountsAndBytes(myChars, 4, 3, u8Nobom)
PrintCountsAndBytes(myChars, 4, 3, u8Bom)
PrintCountsAndBytes(myChars, 4, 3, u32Nobom)
PrintCountsAndBytes(myChars, 4, 3, u32Bom)
End Sub
Public Shared Sub PrintCountsAndBytes(chars() As Char, index As Integer, count As Integer, enc As Encoding)
' Display the name of the encoding used.
Console.Write("{0,-25} :", enc.ToString())
' Display the exact byte count.
Dim iBC As Integer = enc.GetByteCount(chars, index, count)
Console.Write(" {0,-3}", iBC)
' Display the maximum byte count.
Dim iMBC As Integer = enc.GetMaxByteCount(count)
Console.Write(" {0,-3} :", iMBC)
' Get the byte order mark, if any.
Dim preamble As Byte() = enc.GetPreamble()
' Combine the preamble and the encoded bytes.
' NOTE: In Visual Basic, arrays contain one extra element by default.
' The following line creates an array with the exact number of elements required.
Dim bytes(preamble.Length + iBC - 1) As Byte
Array.Copy(preamble, bytes, preamble.Length)
enc.GetBytes(chars, index, count, bytes, preamble.Length)
' Display all the encoded bytes.
PrintHexBytes(bytes)
End Sub
Public Shared Sub PrintHexBytes(bytes() As Byte)
If bytes Is Nothing OrElse bytes.Length = 0 Then
Console.WriteLine("<none>")
Else
Dim i As Integer
For i = 0 To bytes.Length - 1
Console.Write("{0:X2} ", bytes(i))
Next i
Console.WriteLine()
End If
End Sub
End Class
'This code produces the following output.
'
'System.Text.UTF7Encoding : 10 11 :2B 41 37 4C 59 2F 39 7A 2F 2D
'System.Text.UTF8Encoding : 6 12 :CE B2 F1 8F B3 BF
'System.Text.UTF8Encoding : 6 12 :EF BB BF CE B2 F1 8F B3 BF
'System.Text.UTF32Encoding : 8 12 :B2 03 00 00 FF FC 04 00
'System.Text.UTF32Encoding : 8 12 :FF FE 00 00 B2 03 00 00 FF FC 04 00
Poznámky
Pokud chcete vypočítat přesnou velikost pole potřebnou GetBytes k uložení výsledných bajtů, zavoláte metodu GetByteCount . Pokud chcete vypočítat maximální velikost pole, zavoláte metodu GetMaxByteCount . Metoda GetByteCount obecně přiděluje méně paměti, zatímco GetMaxByteCount metoda obvykle provádí rychleji.
Při detekci chyb způsobí neplatná sekvence tuto metodu ArgumentExceptionvyvolá . Bez detekce chyb jsou neplatné sekvence ignorovány a vyvolá se žádná výjimka.
Data, která se mají převést, například data načtená ze streamu, můžou být dostupná jenom v sekvenčních blocích. V tomto případě nebo pokud je množství dat tak velké, že je potřeba je rozdělit na menší bloky, aplikace používá Decoder metodu nebo metodu nebo Encoder GetDecoder metodu GetEncoder .
Důležité
Chcete-li zajistit správné dekódování zakódovaných bajtů při jejich uložení jako souboru nebo jako streamu, můžete předponu datového proudu kódovaných bajtů předponou preambule. Vložení preambule na začátek bajtového datového proudu (například na začátku řady bajtů, které se mají zapsat do souboru) je zodpovědností vývojáře. Metoda GetBytes nepředkládá preambuli na začátek sekvence zakódovaných bajtů.
Viz také
Platí pro
GetBytes(String, Int32, Int32, Byte[], Int32)
Zakóduje sadu znaků ze zadaného String pole do zadaného bajtového pole.
public:
override int GetBytes(System::String ^ s, int charIndex, int charCount, cli::array <System::Byte> ^ bytes, int byteIndex);
public override int GetBytes (string s, int charIndex, int charCount, byte[] bytes, int byteIndex);
override this.GetBytes : string * int * int * byte[] * int -> int
Public Overrides Function GetBytes (s As String, charIndex As Integer, charCount As Integer, bytes As Byte(), byteIndex As Integer) As Integer
Parametry
- charIndex
- Int32
Index prvního znaku, který se má kódovat.
- charCount
- Int32
Počet znaků, které se mají kódovat.
- bytes
- Byte[]
Bajtové pole, které bude obsahovat výslednou posloupnost bajtů.
- byteIndex
- Int32
Index, na kterém začnete psát výslednou sekvenci bajtů.
Návraty
Skutečný počet bajtů zapsaných do bytes
.
Výjimky
charIndex
nebo charCount
byteIndex
je menší než nula.
-nebo-
charIndex
a charCount
neoznamujte platnou oblast v chars
.
-nebo-
byteIndex
není platný index v bytes
.
Detekce chyb je povolená a s
obsahuje neplatnou posloupnost znaků.
-nebo-
bytes
nemá dostatečnou kapacitu od byteIndex
konce pole, aby vyhovovala výsledným bajtům.
Došlo k náhradnímu obnovení (další informace najdete v tématu Kódování znaků v .NET). -a- EncoderFallback je nastavena na EncoderExceptionFallbackhodnotu .
Příklady
Následující příklad určuje počet bajtů potřebných k kódování řetězce a pak zakóduje řetězec a zobrazí výsledné bajty.
using namespace System;
using namespace System::Text;
void PrintCountsAndBytes( String^ s, Encoding^ enc );
void PrintHexBytes( array<Byte>^bytes );
int main()
{
// The characters to encode:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
// a high-surrogate value (U+D8FF)
// a low-surrogate value (U+DCFF)
String^ myStr = L"za\u0306\u01FD\u03B2\xD8FF\xDCFF";
// Create instances of different encodings.
UTF7Encoding^ u7 = gcnew UTF7Encoding;
UTF8Encoding^ u8Nobom = gcnew UTF8Encoding( false,true );
UTF8Encoding^ u8Bom = gcnew UTF8Encoding( true,true );
UTF32Encoding ^ u32Nobom = gcnew UTF32Encoding( false,false,true );
UTF32Encoding ^ u32Bom = gcnew UTF32Encoding( false,true,true );
// Get the byte counts and the bytes.
PrintCountsAndBytes( myStr, u7 );
PrintCountsAndBytes( myStr, u8Nobom );
PrintCountsAndBytes( myStr, u8Bom );
PrintCountsAndBytes( myStr, u32Nobom );
PrintCountsAndBytes( myStr, u32Bom );
}
void PrintCountsAndBytes( String^ s, Encoding^ enc )
{
// Display the name of the encoding used.
Console::Write( "{0,-25} :", enc );
// Display the exact byte count.
int iBC = enc->GetByteCount( s );
Console::Write( " {0,-3}", iBC );
// Display the maximum byte count.
int iMBC = enc->GetMaxByteCount( s->Length );
Console::Write( " {0,-3} :", iMBC );
// Get the byte order mark, if any.
array<Byte>^preamble = enc->GetPreamble();
// Combine the preamble and the encoded bytes.
array<Byte>^bytes = gcnew array<Byte>(preamble->Length + iBC);
Array::Copy( preamble, bytes, preamble->Length );
enc->GetBytes( s, 0, s->Length, bytes, preamble->Length );
// Display all the encoded bytes.
PrintHexBytes( bytes );
}
void PrintHexBytes( array<Byte>^bytes )
{
if ( (bytes == nullptr) || (bytes->Length == 0) )
Console::WriteLine( "<none>" );
else
{
for ( int i = 0; i < bytes->Length; i++ )
Console::Write( "{0:X2} ", bytes[ i ] );
Console::WriteLine();
}
}
/*
This code produces the following output.
System.Text.UTF7Encoding : 18 23 :7A 61 2B 41 77 59 42 2F 51 4F 79 32 50 2F 63 2F 77 2D
System.Text.UTF8Encoding : 12 24 :7A 61 CC 86 C7 BD CE B2 F1 8F B3 BF
System.Text.UTF8Encoding : 12 24 :EF BB BF 7A 61 CC 86 C7 BD CE B2 F1 8F B3 BF
System.Text.UTF32Encoding : 24 28 :7A 00 00 00 61 00 00 00 06 03 00 00 FD 01 00 00 B2 03 00 00 FF FC 04 00
System.Text.UTF32Encoding : 24 28 :FF FE 00 00 7A 00 00 00 61 00 00 00 06 03 00 00 FD 01 00 00 B2 03 00 00 FF FC 04 00
*/
using System;
using System.Text;
public class SamplesUTF32Encoding {
public static void Main() {
// The characters to encode:
// Latin Small Letter Z (U+007A)
// Latin Small Letter A (U+0061)
// Combining Breve (U+0306)
// Latin Small Letter AE With Acute (U+01FD)
// Greek Small Letter Beta (U+03B2)
// a high-surrogate value (U+D8FF)
// a low-surrogate value (U+DCFF)
String myStr = "za\u0306\u01FD\u03B2\uD8FF\uDCFF";
// Create instances of different encodings.
UTF7Encoding u7 = new UTF7Encoding();
UTF8Encoding u8Nobom = new UTF8Encoding( false, true );
UTF8Encoding u8Bom = new UTF8Encoding( true, true );
UTF32Encoding u32Nobom = new UTF32Encoding( false, false, true );
UTF32Encoding u32Bom = new UTF32Encoding( false, true, true );
// Get the byte counts and the bytes.
PrintCountsAndBytes( myStr, u7 );
PrintCountsAndBytes( myStr, u8Nobom );
PrintCountsAndBytes( myStr, u8Bom );
PrintCountsAndBytes( myStr, u32Nobom );
PrintCountsAndBytes( myStr, u32Bom );
}
public static void PrintCountsAndBytes( String s, Encoding enc ) {
// Display the name of the encoding used.
Console.Write( "{0,-25} :", enc.ToString() );
// Display the exact byte count.
int iBC = enc.GetByteCount( s );
Console.Write( " {0,-3}", iBC );
// Display the maximum byte count.
int iMBC = enc.GetMaxByteCount( s.Length );
Console.Write( " {0,-3} :", iMBC );
// Get the byte order mark, if any.
byte[] preamble = enc.GetPreamble();
// Combine the preamble and the encoded bytes.
byte[] bytes = new byte[preamble.Length + iBC];
Array.Copy( preamble, bytes, preamble.Length );
enc.GetBytes( s, 0, s.Length, bytes, preamble.Length );
// Display all the encoded bytes.
PrintHexBytes( bytes );
}
public static void PrintHexBytes( byte[] bytes ) {
if (( bytes == null ) || ( bytes.Length == 0 ))
{
Console.WriteLine( "<none>" );
}
else {
for ( int i = 0; i < bytes.Length; i++ )
Console.Write( "{0:X2} ", bytes[i] );
Console.WriteLine();
}
}
}
/*
This code produces the following output.
System.Text.UTF7Encoding : 18 23 :7A 61 2B 41 77 59 42 2F 51 4F 79 32 50 2F 63 2F 77 2D
System.Text.UTF8Encoding : 12 24 :7A 61 CC 86 C7 BD CE B2 F1 8F B3 BF
System.Text.UTF8Encoding : 12 24 :EF BB BF 7A 61 CC 86 C7 BD CE B2 F1 8F B3 BF
System.Text.UTF32Encoding : 24 28 :7A 00 00 00 61 00 00 00 06 03 00 00 FD 01 00 00 B2 03 00 00 FF FC 04 00
System.Text.UTF32Encoding : 24 28 :FF FE 00 00 7A 00 00 00 61 00 00 00 06 03 00 00 FD 01 00 00 B2 03 00 00 FF FC 04 00
*/
Imports System.Text
Public Class SamplesUTF32Encoding
Public Shared Sub Main()
' The characters to encode:
' Latin Small Letter Z (U+007A)
' Latin Small Letter A (U+0061)
' Combining Breve (U+0306)
' Latin Small Letter AE With Acute (U+01FD)
' Greek Small Letter Beta (U+03B2)
' a high-surrogate value (U+D8FF)
' a low-surrogate value (U+DCFF)
Dim myStr As String = "za" & ChrW(&H0306) & ChrW(&H01FD) & ChrW(&H03B2) & ChrW(&HD8FF) & ChrW(&HDCFF)
' Create instances of different encodings.
Dim u7 As New UTF7Encoding()
Dim u8Nobom As New UTF8Encoding(False, True)
Dim u8Bom As New UTF8Encoding(True, True)
Dim u32Nobom As New UTF32Encoding(False, False, True)
Dim u32Bom As New UTF32Encoding(False, True, True)
' Get the byte counts and the bytes.
PrintCountsAndBytes(myStr, u7)
PrintCountsAndBytes(myStr, u8Nobom)
PrintCountsAndBytes(myStr, u8Bom)
PrintCountsAndBytes(myStr, u32Nobom)
PrintCountsAndBytes(myStr, u32Bom)
End Sub
Public Shared Sub PrintCountsAndBytes(s As String, enc As Encoding)
' Display the name of the encoding used.
Console.Write("{0,-25} :", enc.ToString())
' Display the exact byte count.
Dim iBC As Integer = enc.GetByteCount(s)
Console.Write(" {0,-3}", iBC)
' Display the maximum byte count.
Dim iMBC As Integer = enc.GetMaxByteCount(s.Length)
Console.Write(" {0,-3} :", iMBC)
' Get the byte order mark, if any.
Dim preamble As Byte() = enc.GetPreamble()
' Combine the preamble and the encoded bytes.
' NOTE: In Visual Basic, arrays contain one extra element by default.
' The following line creates an array with the exact number of elements required.
Dim bytes(preamble.Length + iBC - 1) As Byte
Array.Copy(preamble, bytes, preamble.Length)
enc.GetBytes(s, 0, s.Length, bytes, preamble.Length)
' Display all the encoded bytes.
PrintHexBytes(bytes)
End Sub
Public Shared Sub PrintHexBytes(bytes() As Byte)
If bytes Is Nothing OrElse bytes.Length = 0 Then
Console.WriteLine("<none>")
Else
Dim i As Integer
For i = 0 To bytes.Length - 1
Console.Write("{0:X2} ", bytes(i))
Next i
Console.WriteLine()
End If
End Sub
End Class
'This code produces the following output.
'
'System.Text.UTF7Encoding : 18 23 :7A 61 2B 41 77 59 42 2F 51 4F 79 32 50 2F 63 2F 77 2D
'System.Text.UTF8Encoding : 12 24 :7A 61 CC 86 C7 BD CE B2 F1 8F B3 BF
'System.Text.UTF8Encoding : 12 24 :EF BB BF 7A 61 CC 86 C7 BD CE B2 F1 8F B3 BF
'System.Text.UTF32Encoding : 24 28 :7A 00 00 00 61 00 00 00 06 03 00 00 FD 01 00 00 B2 03 00 00 FF FC 04 00
'System.Text.UTF32Encoding : 24 28 :FF FE 00 00 7A 00 00 00 61 00 00 00 06 03 00 00 FD 01 00 00 B2 03 00 00 FF FC 04 00
Poznámky
Pokud chcete vypočítat přesnou velikost pole potřebnou GetBytes k uložení výsledných bajtů, zavoláte metodu GetByteCount . Pokud chcete vypočítat maximální velikost pole, zavoláte metodu GetMaxByteCount . Metoda GetByteCount obecně přiděluje méně paměti, zatímco GetMaxByteCount metoda obvykle provádí rychleji.
Při detekci chyb způsobí neplatná sekvence tuto metodu ArgumentExceptionvyvolá . Bez detekce chyb jsou neplatné sekvence ignorovány a vyvolá se žádná výjimka.
Data, která se mají převést, například data načtená ze streamu, můžou být dostupná jenom v sekvenčních blocích. V tomto případě nebo pokud je množství dat tak velké, že je potřeba je rozdělit na menší bloky, aplikace používá Decoder metodu nebo metodu nebo Encoder GetDecoder metodu GetEncoder .
Důležité
Chcete-li zajistit správné dekódování zakódovaných bajtů při jejich uložení jako souboru nebo jako streamu, můžete předponu datového proudu kódovaných bajtů předponou preambule. Vložení preambule na začátek bajtového datového proudu (například na začátku řady bajtů, které se mají zapsat do souboru) je zodpovědností vývojáře. Metoda GetBytes nepředkládá preambuli na začátek sekvence zakódovaných bajtů.