UTF32Encoding クラス

定義

Unicode 文字の UTF-32 エンコーディングを表します。Represents a UTF-32 encoding of Unicode characters.

public ref class UTF32Encoding sealed : System::Text::Encoding
public sealed class UTF32Encoding : System.Text.Encoding
[System.Serializable]
public sealed class UTF32Encoding : System.Text.Encoding
type UTF32Encoding = class
    inherit Encoding
[<System.Serializable>]
type UTF32Encoding = class
    inherit Encoding
Public NotInheritable Class UTF32Encoding
Inherits Encoding
継承
UTF32Encoding
属性

次の例では、 UTF32Encoding エラー検出を有効にした場合と使用しない場合のオブジェクトの動作を示します。The following example demonstrates the behavior of UTF32Encoding objects with and without error detection enabled. 最後の4バイトが無効なサロゲートペアを表すバイト配列を作成します。上位サロゲート U + D8FF の後に U + 01FF が続きます。これは、下限サロゲート (0xDC00 ~ から 0xdfff) の範囲外です。It creates a byte array whose last four bytes represent an invalid surrogate pair; the high surrogate U+D8FF is followed by an U+01FF, which is outside the range of low surrogates (0xDC00 through 0xDFFF). エラー検出を行わない場合、UTF32 デコーダーは置換フォールバックを使用して、無効なサロゲートペアを置換文字 (U + FFFD) に置き換えます。Without error detection, the UTF32 decoder uses replacement fallback to replace the invalid surrogate pair with REPLACEMENT CHARACTER (U+FFFD).

using namespace System;
using namespace System::Text;
void PrintDecodedString( array<Byte>^bytes, Encoding^ enc );
int main()
{
   
   // Create an instance of UTF32Encoding using little-endian byte order.
   // This will be used for encoding.
   UTF32Encoding^ u32LE = gcnew UTF32Encoding( false,true );
   
   // Create two instances of UTF32Encoding using big-endian byte order: one with error detection and one without.
   // These will be used for decoding.
   UTF32Encoding^ u32withED = gcnew UTF32Encoding( true,true,true );
   UTF32Encoding^ u32noED = gcnew UTF32Encoding( true,true,false );
   
   // Create byte arrays from the same string containing the following characters:
   //    Latin Small Letter Z (U+007A)
   //    Latin Small Letter A (U+0061)
   //    Combining Breve (U+0306)
   //    Latin Small Letter AE With Acute (U+01FD)
   //    Greek Small Letter Beta (U+03B2)
   String^ myStr = L"za\u0306\u01FD\u03B2\xD8FF\xDCFF";
   
   // Encode the string using little-endian byte order.
   array<Byte>^myBytes = gcnew array<Byte>(u32LE->GetByteCount( myStr ));
   u32LE->GetBytes( myStr, 0, myStr->Length, myBytes, 0 );
   
   // Decode the byte array with error detection.
   Console::WriteLine( "Decoding with error detection:" );
   PrintDecodedString( myBytes, u32withED );
   
   // Decode the byte array without error detection.
   Console::WriteLine( "Decoding without error detection:" );
   PrintDecodedString( myBytes, u32noED );
}


// Decode the bytes and display the string.
void PrintDecodedString( array<Byte>^bytes, Encoding^ enc )
{
   try
   {
      Console::WriteLine( "   Decoded string: {0}", enc->GetString( bytes, 0, bytes->Length ) );
   }
   catch ( System::ArgumentException^ e ) 
   {
      Console::WriteLine( e );
   }

   Console::WriteLine();
}
using System;
using System.Text;

public class Example
{
   public static void Main()
   {
     // Create a UTF32Encoding object with error detection enabled.
      var encExc = new UTF32Encoding(! BitConverter.IsLittleEndian, true, true);
      // Create a UTF32Encoding object with error detection disabled.
      var encRepl = new UTF32Encoding(! BitConverter.IsLittleEndian, true, false);

      // Create a byte arrays from a string, and add an invalid surrogate pair, as follows.
      //    Latin Small Letter Z (U+007A)
      //    Latin Small Letter A (U+0061)
      //    Combining Breve (U+0306)
      //    Latin Small Letter AE With Acute (U+01FD)
      //    Greek Small Letter Beta (U+03B2)
      //    a high-surrogate value (U+D8FF)
      //    an invalid low surrogate (U+01FF)
      String s = "za\u0306\u01FD\u03B2";

      // Encode the string using little-endian byte order.
      int index = encExc.GetByteCount(s);
      Byte[] bytes = new Byte[index + 4];
      encExc.GetBytes(s, 0, s.Length, bytes, 0);
      bytes[index] = 0xFF;
      bytes[index + 1] = 0xD8;
      bytes[index + 2] = 0xFF;
      bytes[index + 3] = 0x01;

      // Decode the byte array with error detection.
      Console.WriteLine("Decoding with error detection:");
      PrintDecodedString(bytes, encExc);

      // Decode the byte array without error detection.
      Console.WriteLine("Decoding without error detection:");
      PrintDecodedString(bytes, encRepl);
   }

   // Decode the bytes and display the string.
   public static void PrintDecodedString(Byte[] bytes, Encoding enc)
   {
      try {
         Console.WriteLine("   Decoded string: {0}", enc.GetString(bytes, 0, bytes.Length));
      }
      catch (DecoderFallbackException e) {
         Console.WriteLine(e.ToString());
      }
      Console.WriteLine();
   }
}
// The example displays the following output:
//    Decoding with error detection:
//    System.Text.DecoderFallbackException: Unable to translate bytes [FF][D8][FF][01] at index
//    20 from specified code page to Unicode.
//       at System.Text.DecoderExceptionFallbackBuffer.Throw(Byte[] bytesUnknown, Int32 index)
//       at System.Text.DecoderExceptionFallbackBuffer.Fallback(Byte[] bytesUnknown, Int32 index
//    )
//       at System.Text.DecoderFallbackBuffer.InternalFallback(Byte[] bytes, Byte* pBytes)
//       at System.Text.UTF32Encoding.GetCharCount(Byte* bytes, Int32 count, DecoderNLS baseDeco
//    der)
//       at System.Text.UTF32Encoding.GetString(Byte[] bytes, Int32 index, Int32 count)
//       at Example.PrintDecodedString(Byte[] bytes, Encoding enc)
//
//    Decoding without error detection:
//       Decoded string: zăǽβ�
Imports System.Text

Public Module Example
   Public Sub Main()
      ' Create a UTF32Encoding object with error detection enabled.
      Dim encExc As New UTF32Encoding(Not BitConverter.IsLittleEndian, True, True)
      ' Create a UTF32Encoding object with error detection disabled.
      Dim encRepl As New UTF32Encoding(Not BitConverter.IsLittleEndian, True, False)

      ' Create a byte arrays from a string, and add an invalid surrogate pair, as follows.
      '    Latin Small Letter Z (U+007A)
      '    Latin Small Letter A (U+0061)
      '    Combining Breve (U+0306)
      '    Latin Small Letter AE With Acute (U+01FD)
      '    Greek Small Letter Beta (U+03B2)
      '    a high-surrogate value (U+D8FF)
      '    an invalid low surrogate (U+01FF)
      Dim s As String = "za" & ChrW(&H0306) & ChrW(&H01FD) & ChrW(&H03B2)

      ' Encode the string using little-endian byte order.
      Dim index As Integer = encExc.GetBytecount(s)
      Dim bytes(index + 3) As Byte
      encExc.GetBytes(s, 0, s.Length, bytes, 0)
      bytes(index) = &hFF
      bytes(index + 1) = &hD8
      bytes(index + 2) = &hFF
      bytes(index + 3) = &h01

      ' Decode the byte array with error detection.
      Console.WriteLine("Decoding with error detection:")
      PrintDecodedString(bytes, encExc)

      ' Decode the byte array without error detection.
      Console.WriteLine("Decoding without error detection:")
      PrintDecodedString(bytes, encRepl)
   End Sub

   ' Decode the bytes and display the string.
   Public Sub PrintDecodedString(bytes() As Byte, enc As Encoding)
      Try
         Console.WriteLine("   Decoded string: {0}", enc.GetString(bytes, 0, bytes.Length))
      Catch e As DecoderFallbackException
         Console.WriteLine(e.ToString())
      End Try
      Console.WriteLine()
   End Sub
End Module
' The example displays the following output:
'    Decoding with error detection:
'    System.Text.DecoderFallbackException: Unable to translate bytes [FF][D8][FF][01] at index
'    20 from specified code page to Unicode.
'       at System.Text.DecoderExceptionFallbackBuffer.Throw(Byte[] bytesUnknown, Int32 index)
'       at System.Text.DecoderExceptionFallbackBuffer.Fallback(Byte[] bytesUnknown, Int32 index
'    )
'       at System.Text.DecoderFallbackBuffer.InternalFallback(Byte[] bytes, Byte* pBytes)
'       at System.Text.UTF32Encoding.GetCharCount(Byte* bytes, Int32 count, DecoderNLS baseDeco
'    der)
'       at System.Text.UTF32Encoding.GetString(Byte[] bytes, Int32 index, Int32 count)
'       at Example.PrintDecodedString(Byte[] bytes, Encoding enc)
'
'    Decoding without error detection:
'       Decoded string: zăǽβ�

次の例では、オブジェクトを使用して、Unicode 文字の文字列をバイト配列にエンコードし UTF32Encoding ます。The following example encodes a string of Unicode characters into a byte array by using a UTF32Encoding object. バイト配列は、データが失われていないことを示すために、文字列にデコードされます。The byte array is then decoded into a string to demonstrate that there is no loss of data.

using System;
using System.Text;

public class Example
{
    public static void Main()
    {
        // The encoding.
        var enc = new UTF32Encoding();
        
        // Create a string.
        String s = "This string contains two characters " +
                   "with codes outside the ASCII code range: " +
                   "Pi (\u03A0) and Sigma (\u03A3).";
        Console.WriteLine("Original string:");
        Console.WriteLine("   {0}", s);
        
        // Encode the string.
        Byte[] encodedBytes = enc.GetBytes(s);
        Console.WriteLine();
        Console.WriteLine("Encoded bytes:");
        for (int ctr = 0; ctr < encodedBytes.Length; ctr++) {
            Console.Write("[{0:X2}]{1}", encodedBytes[ctr],
                                         (ctr + 1) % 4 == 0 ? " " : "" );
            if ((ctr + 1) % 16 == 0) Console.WriteLine();
        }
        Console.WriteLine();
        
        // Decode bytes back to string.
        // Notice Pi and Sigma characters are still present.
        String decodedString = enc.GetString(encodedBytes);
        Console.WriteLine();
        Console.WriteLine("Decoded string:");
        Console.WriteLine("   {0}", decodedString);
    }
}
// The example displays the following output:
//    Original string:
//       This string contains two characters with codes outside the ASCII code range:
//    Pi (π) and Sigma (Σ).
//
//    Encoded bytes:
//    [54][00][00][00] [68][00][00][00] [69][00][00][00] [73][00][00][00]
//    [20][00][00][00] [73][00][00][00] [74][00][00][00] [72][00][00][00]
//    [69][00][00][00] [6E][00][00][00] [67][00][00][00] [20][00][00][00]
//    [63][00][00][00] [6F][00][00][00] [6E][00][00][00] [74][00][00][00]
//    [61][00][00][00] [69][00][00][00] [6E][00][00][00] [73][00][00][00]
//    [20][00][00][00] [74][00][00][00] [77][00][00][00] [6F][00][00][00]
//    [20][00][00][00] [63][00][00][00] [68][00][00][00] [61][00][00][00]
//    [72][00][00][00] [61][00][00][00] [63][00][00][00] [74][00][00][00]
//    [65][00][00][00] [72][00][00][00] [73][00][00][00] [20][00][00][00]
//    [77][00][00][00] [69][00][00][00] [74][00][00][00] [68][00][00][00]
//    [20][00][00][00] [63][00][00][00] [6F][00][00][00] [64][00][00][00]
//    [65][00][00][00] [73][00][00][00] [20][00][00][00] [6F][00][00][00]
//    [75][00][00][00] [74][00][00][00] [73][00][00][00] [69][00][00][00]
//    [64][00][00][00] [65][00][00][00] [20][00][00][00] [74][00][00][00]
//    [68][00][00][00] [65][00][00][00] [20][00][00][00] [41][00][00][00]
//    [53][00][00][00] [43][00][00][00] [49][00][00][00] [49][00][00][00]
//    [20][00][00][00] [63][00][00][00] [6F][00][00][00] [64][00][00][00]
//    [65][00][00][00] [20][00][00][00] [72][00][00][00] [61][00][00][00]
//    [6E][00][00][00] [67][00][00][00] [65][00][00][00] [3A][00][00][00]
//    [20][00][00][00] [50][00][00][00] [69][00][00][00] [20][00][00][00]
//    [28][00][00][00] [A0][03][00][00] [29][00][00][00] [20][00][00][00]
//    [61][00][00][00] [6E][00][00][00] [64][00][00][00] [20][00][00][00]
//    [53][00][00][00] [69][00][00][00] [67][00][00][00] [6D][00][00][00]
//    [61][00][00][00] [20][00][00][00] [28][00][00][00] [A3][03][00][00]
//    [29][00][00][00] [2E][00][00][00]
//
//    Decoded string:
//       This string contains two characters with codes outside the ASCII code range:
//    Pi (π) and Sigma (Σ).
Imports System.Text

Class Example
    Public Shared Sub Main()
        ' The encoding.
        Dim enc As New UTF32Encoding()
        
        ' Create a string.
        Dim s As String =
            "This string contains two characters " &
            "with codes outside the ASCII code range: " &
            "Pi (" & ChrW(&h03A0) & ") and Sigma (" & ChrW(&h03A3) & ")."
        Console.WriteLine("Original string:")
        Console.WriteLine("   {0}", s)
        
        ' Encode the string.
        Dim encodedBytes As Byte() = enc.GetBytes(s)
        Console.WriteLine()
        Console.WriteLine("Encoded bytes:")
        For ctr As Integer = 0 To encodedBytes.Length - 1
            Console.Write("[{0:X2}]{1}", encodedBytes(ctr),
                                         If((ctr + 1) Mod 4 = 0, " ", "" ))
            If (ctr + 1) Mod 16 = 0 Then Console.WriteLine()
        Next
        Console.WriteLine()
        
        ' Decode bytes back to string.
        ' Notice Pi and Sigma characters are still present.
        Dim decodedString As String = enc.GetString(encodedBytes)
        Console.WriteLine()
        Console.WriteLine("Decoded string:")
        Console.WriteLine("   {0}", decodedString)
    End Sub
End Class
' The example displays the following output:
'    Original string:
'       This string contains two characters with codes outside the ASCII code range:
'    Pi (π) and Sigma (Σ).
'
'    Encoded bytes:
'    [54][00][00][00] [68][00][00][00] [69][00][00][00] [73][00][00][00]
'    [20][00][00][00] [73][00][00][00] [74][00][00][00] [72][00][00][00]
'    [69][00][00][00] [6E][00][00][00] [67][00][00][00] [20][00][00][00]
'    [63][00][00][00] [6F][00][00][00] [6E][00][00][00] [74][00][00][00]
'    [61][00][00][00] [69][00][00][00] [6E][00][00][00] [73][00][00][00]
'    [20][00][00][00] [74][00][00][00] [77][00][00][00] [6F][00][00][00]
'    [20][00][00][00] [63][00][00][00] [68][00][00][00] [61][00][00][00]
'    [72][00][00][00] [61][00][00][00] [63][00][00][00] [74][00][00][00]
'    [65][00][00][00] [72][00][00][00] [73][00][00][00] [20][00][00][00]
'    [77][00][00][00] [69][00][00][00] [74][00][00][00] [68][00][00][00]
'    [20][00][00][00] [63][00][00][00] [6F][00][00][00] [64][00][00][00]
'    [65][00][00][00] [73][00][00][00] [20][00][00][00] [6F][00][00][00]
'    [75][00][00][00] [74][00][00][00] [73][00][00][00] [69][00][00][00]
'    [64][00][00][00] [65][00][00][00] [20][00][00][00] [74][00][00][00]
'    [68][00][00][00] [65][00][00][00] [20][00][00][00] [41][00][00][00]
'    [53][00][00][00] [43][00][00][00] [49][00][00][00] [49][00][00][00]
'    [20][00][00][00] [63][00][00][00] [6F][00][00][00] [64][00][00][00]
'    [65][00][00][00] [20][00][00][00] [72][00][00][00] [61][00][00][00]
'    [6E][00][00][00] [67][00][00][00] [65][00][00][00] [3A][00][00][00]
'    [20][00][00][00] [50][00][00][00] [69][00][00][00] [20][00][00][00]
'    [28][00][00][00] [A0][03][00][00] [29][00][00][00] [20][00][00][00]
'    [61][00][00][00] [6E][00][00][00] [64][00][00][00] [20][00][00][00]
'    [53][00][00][00] [69][00][00][00] [67][00][00][00] [6D][00][00][00]
'    [61][00][00][00] [20][00][00][00] [28][00][00][00] [A3][03][00][00]
'    [29][00][00][00] [2E][00][00][00]
'
'    Decoded string:
'       This string contains two characters with codes outside the ASCII code range:
'    Pi (π) and Sigma (Σ).

次の例では、前の例と同じ文字列を使用します。ただし、エンコードされたバイトをファイルに書き込み、バイトストリームのプレフィックスをバイト順マーク (BOM) にします。The following example uses the same string as the previous one, except that it writes the encoded bytes to a file and prefixes the byte stream with a byte order mark (BOM). 次に、オブジェクトを使用したテキストファイルとして、 StreamReader およびバイナリファイルとして、ファイルを2つの異なる方法で読み取ります。It then reads the file in two different ways: as a text file by using a StreamReader object; and as a binary file. 予想どおり、新しく読み込まれた文字列には BOM が含まれていません。As you would expect, neither newly-read string includes the BOM.

using System;
using System.IO;
using System.Text;

public class Example
{
    public static void Main()
    {
        // Create a UTF-32 encoding that supports a BOM.
        var enc = new UTF32Encoding();
        
        // A Unicode string with two characters outside an 8-bit code range.
        String s = "This Unicode string has 2 characters " +
                   "outside the ASCII range: \n" +
                   "Pi (\u03A0), and Sigma (\u03A3).";
        Console.WriteLine("Original string:");
        Console.WriteLine(s);
        Console.WriteLine();
        
        // Encode the string.
        Byte[] encodedBytes = enc.GetBytes(s);
        Console.WriteLine("The encoded string has {0} bytes.\n",
                          encodedBytes.Length);

        // Write the bytes to a file with a BOM.
        var fs = new FileStream(@".\UTF32Encoding.txt", FileMode.Create);
        Byte[] bom = enc.GetPreamble();
        fs.Write(bom, 0, bom.Length);
        fs.Write(encodedBytes, 0, encodedBytes.Length);
        Console.WriteLine("Wrote {0} bytes to the file.\n", fs.Length);
        fs.Close();

        // Open the file using StreamReader.
        var sr = new StreamReader(@".\UTF32Encoding.txt");
        String newString = sr.ReadToEnd();
        sr.Close();
        Console.WriteLine("String read using StreamReader:");
        Console.WriteLine(newString);
        Console.WriteLine();
        
        // Open the file as a binary file and decode the bytes back to a string.
        fs = new FileStream(@".\Utf32Encoding.txt", FileMode.Open);
        Byte[] bytes = new Byte[fs.Length];
        fs.Read(bytes, 0, (int)fs.Length);
        fs.Close();

        String decodedString = enc.GetString(bytes);
        Console.WriteLine("Decoded bytes from binary file:");
        Console.WriteLine(decodedString);
    }
}
// The example displays the following output:
//    Original string:
//    This Unicode string has 2 characters outside the ASCII range:
//    Pi (π), and Sigma (Σ).
//
//    The encoded string has 340 bytes.
//
//    Wrote 344 bytes to the file.
//
//    String read using StreamReader:
//    This Unicode string has 2 characters outside the ASCII range:
//    Pi (π), and Sigma (Σ).
//
//    Decoded bytes from binary file:
//    This Unicode string has 2 characters outside the ASCII range:
//    Pi (π), and Sigma (Σ).
Imports System.IO
Imports System.Text

Class Example
    Public Shared Sub Main()
        ' Create a UTF-32 encoding that supports a BOM.
        Dim enc As New UTF32Encoding()
        
        ' A Unicode string with two characters outside an 8-bit code range.
        Dim s As String = _
            "This Unicode string has 2 characters outside the " &
            "ASCII range: " & vbCrLf &
            "Pi (" & ChrW(&h03A0) & "), and Sigma (" & ChrW(&h03A3) & ")."
        Console.WriteLine("Original string:")
        Console.WriteLine(s)
        Console.WriteLine()
        
        ' Encode the string.
        Dim encodedBytes As Byte() = enc.GetBytes(s)
        Console.WriteLine("The encoded string has {0} bytes.",
                          encodedBytes.Length)
        Console.WriteLine()
        
        ' Write the bytes to a file with a BOM.
        Dim fs As New FileStream(".\UTF32Encoding.txt", FileMode.Create)
        Dim bom() As Byte = enc.GetPreamble()
        fs.Write(bom, 0, bom.Length)
        fs.Write(encodedBytes, 0, encodedBytes.Length)
        Console.WriteLine("Wrote {0} bytes to the file.", fs.Length)
        fs.Close()
        Console.WriteLine()
        
        ' Open the file using StreamReader.
        Dim sr As New StreamReader(".\UTF32Encoding.txt")
        Dim newString As String = sr.ReadToEnd()
        sr.Close()
        Console.WriteLine("String read using StreamReader:")
        Console.WriteLine(newString)
        Console.WriteLine()
        
        ' Open the file as a binary file and decode the bytes back to a string.
        fs = new FileStream(".\Utf32Encoding.txt", FileMode.Open)
        Dim bytes(fs.Length - 1) As Byte
        fs.Read(bytes, 0, fs.Length)
        fs.Close()

        Dim decodedString As String = enc.GetString(bytes)
        Console.WriteLine("Decoded bytes from binary file:")
        Console.WriteLine(decodedString)
    End Sub
End Class
' The example displays the following output:
'    Original string:
'    This Unicode string has 2 characters outside the ASCII range:
'    Pi (π), and Sigma (Σ).
'
'    The encoded string has 344 bytes.
'
'    Wrote 348 bytes to the file.
'
'    String read using StreamReader:
'    This Unicode string has 2 characters outside the ASCII range:
'    Pi (π), and Sigma (Σ).
'
'    Decoded bytes from binary file:
'    This Unicode string has 2 characters outside the ASCII range:
'    Pi (π), and Sigma (Σ).

注釈

エンコーディングは、Unicode 文字のセットをバイト シーケンスに変換するプロセスです。Encoding is the process of transforming a set of Unicode characters into a sequence of bytes. デコードとは、エンコードされたバイトシーケンスを Unicode 文字のセットに変換するプロセスです。Decoding is the process of transforming a sequence of encoded bytes into a set of Unicode characters.

Unicode 規格では、サポートされているすべてのスクリプトの各文字にコードポイント (数値) が割り当てられます。The Unicode Standard assigns a code point (a number) to each character in every supported script. Unicode 変換形式 (UTF) は、そのコードポイントをエンコードする方法です。A Unicode Transformation Format (UTF) is a way to encode that code point. Unicode 標準では、次の utfs を使用します。The Unicode Standard uses the following UTFs:

  • UTF-8。各コードポイントを 1 ~ 4 バイトのシーケンスとして表します。UTF-8, which represents each code point as a sequence of one to four bytes.

  • UTF-16。各コードポイントを 1 ~ 2 16 ビットの整数のシーケンスとして表します。UTF-16, which represents each code point as a sequence of one to two 16-bit integers.

  • 32 UTF-8。各コードポイントを32ビット整数として表します。UTF-32, which represents each code point as a 32-bit integer.

UTFs およびでサポートされているその他のエンコーディングの詳細について System.Text は、「 .net での文字エンコード」を参照してください。For more information about the UTFs and other encodings supported by System.Text, see Character Encoding in .NET.

クラスは、 UTF32Encoding 32 エンコーディングを表します。The UTF32Encoding class represents a UTF-32 encoding. エンコーダーでは、ビッグエンディアンバイト順 (最初に最上位バイト) またはリトルエンディアンバイト順 (最下位バイトが先頭) を使用できます。The encoder can use the big endian byte order (most significant byte first) or the little endian byte order (least significant byte first). たとえば、ラテン文字の大文字 A (コードポイント U + 0041 という) は、次のようにシリアル化されます (16 進数)。For example, the Latin Capital Letter A (code point U+0041) is serialized as follows (in hexadecimal):

  • ビッグエンディアンのバイト順:00 00 00 41Big endian byte order: 00 00 00 41

  • リトルエンディアンバイト順:41 00 00 00Little endian byte order: 41 00 00 00

一般に、ネイティブバイト順序を使用して Unicode 文字を格納する方が効率的です。It is generally more efficient to store Unicode characters using the native byte order. たとえば、Intel コンピューターなどのリトルエンディアンプラットフォームでは、リトルエンディアンのバイト順を使用することをお勧めします。For example, it is better to use the little endian byte order on little endian platforms, such as Intel computers. UTF32Encoding Windows コードページ 12000 (リトルエンディアンバイト順) と 12001 (ビッグエンディアンバイト順) に対応します。UTF32Encoding corresponds to the Windows code pages 12000 (little endian byte order) and 12001 (big endian byte order). 特定のアーキテクチャの "エンディアン" を確認するには、メソッドを呼び出し BitConverter.IsLittleEndian ます。You can determine the "endianness" of a particular architecture by calling the BitConverter.IsLittleEndian method.

必要に応じて、オブジェクトはバイト UTF32Encoding 順マーク (BOM) を提供します。これは、エンコーディングプロセスによって生成されるバイトシーケンスにプレフィックスを付けることができるバイトの配列です。Optionally, the UTF32Encoding object provides a byte order mark (BOM), which is an array of bytes that can be prefixed to the sequence of bytes resulting from the encoding process. プリアンブルにバイトオーダーマーク (BOM) が含まれている場合は、デコーダーがバイト配列のバイト順と変換形式または UTF を決定するのに役立ちます。If the preamble contains a byte order mark (BOM), it helps the decoder determine the byte order and the transformation format or UTF of a byte array.

UTF32Encodingインスタンスが BOM を提供するように構成されている場合は、メソッドを呼び出すことによって取得できます GetPreamble 。それ以外の場合、メソッドは空の配列を返します。If the UTF32Encoding instance is configured to provide a BOM, you can retrieve it by calling the GetPreamble method; otherwise, the method returns an empty array. オブジェクトが BOM サポート用に構成されている場合でも、必要に応じて、エンコードされた UTF32Encoding バイトストリームの先頭に bom を含める必要があることに注意してください。クラスのエンコーディングメソッドでは、 UTF32Encoding これは自動的には行われません。Note that, even if a UTF32Encoding object is configured for BOM support, you must include the BOM at the beginning of the encoded byte stream as appropriate; the encoding methods of the UTF32Encoding class do not do this automatically.

注意事項

エラー検出を有効にし、クラスインスタンスのセキュリティを強化するには、 UTF32Encoding コンストラクターを呼び出し、 UTF32Encoding(Boolean, Boolean, Boolean) その引数をに設定して、オブジェクトをインスタンス化する必要があり throwOnInvalidBytes true ます。To enable error detection and to make the class instance more secure, you should instantiate a UTF32Encoding object by calling the UTF32Encoding(Boolean, Boolean, Boolean) constructor and setting its throwOnInvalidBytes argument to true. エラー検出を使用すると、無効な文字またはバイトのシーケンスを検出するメソッドが例外をスロー ArgumentException します。With error detection, a method that detects an invalid sequence of characters or bytes throws an ArgumentException exception. エラー検出を行わないと、例外はスローされず、無効なシーケンスは通常は無視されます。Without error detection, no exception is thrown, and the invalid sequence is generally ignored.

オブジェクトをインスタンス化するには、 UTF32Encoding バイト順マーク (BOM) を提供するかどうか、ビッグエンディアンまたはリトルエンディアンエンコーディングを使用するかどうか、エラー検出を有効にするかどうかなど、さまざまな方法があります。You can instantiate a UTF32Encoding object in a number of ways, depending on whether you want to it to provide a byte order mark (BOM), whether you want big-endian or little-endian encoding, and whether you want to enable error detection. 次の表に、 UTF32Encoding Encoding オブジェクトを返すコンストラクターとプロパティを示し UnicodeEncoding ます。The following table lists the UTF32Encoding constructors and the Encoding properties that return a UnicodeEncoding object.

メンバーMember エンディアンEndianness 消費BOM エラー検出Error detection
Encoding.UTF32 リトルエンディアンLittle-endian はいYes いいえ (置換フォールバック)No (Replacement fallback)
UTF32Encoding.UTF32Encoding() リトルエンディアンLittle-endian はいYes いいえ (置換フォールバック)No (Replacement fallback)
UTF32Encoding.UTF32Encoding(Boolean, Boolean) 構成可能Configurable 構成可能Configurable いいえ (置換フォールバック)No (Replacement fallback)
UTF32Encoding.UTF32Encoding(Boolean, Boolean, Boolean) 構成可能Configurable 構成可能Configurable 構成可能Configurable

メソッドによって、 GetByteCount Unicode 文字のセットをエンコードするバイト数が決定され、 GetBytes メソッドは実際のエンコーディングを実行します。The GetByteCount method determines how many bytes result in encoding a set of Unicode characters, and the GetBytes method performs the actual encoding.

同様に、 GetCharCount メソッドはバイトシーケンスをデコードする文字数を決定し、 GetChars GetString メソッドとメソッドは実際のデコードを実行します。Likewise, the GetCharCount method determines how many characters result in decoding a sequence of bytes, and the GetChars and GetString methods perform the actual decoding.

複数のブロックにまたがるデータをエンコードまたはデコードするときに状態情報を保存できるエンコーダーまたはデコーダー (10万文字セグメントでエンコードされた100万文字の文字列など) では GetEncoderGetDecoder プロパティとプロパティをそれぞれ使用します。For an encoder or decoder that is able to save state information when encoding or decoding data that spans multiple blocks (such as string of 1 million characters that is encoded in 100,000-character segments), use the GetEncoder and GetDecoder properties, respectively.

コンストラクター

UTF32Encoding()

UTF32Encoding クラスの新しいインスタンスを初期化します。Initializes a new instance of the UTF32Encoding class.

UTF32Encoding(Boolean, Boolean)

UTF32Encoding クラスの新しいインスタンスを初期化します。Initializes a new instance of the UTF32Encoding class. パラメーターでは、ビッグ エンディアン バイト順を使用するかどうか、および GetPreamble() メソッドが Unicode バイト順マークを返すかどうかを指定します。Parameters specify whether to use the big endian byte order and whether the GetPreamble() method returns a Unicode byte order mark.

UTF32Encoding(Boolean, Boolean, Boolean)

UTF32Encoding クラスの新しいインスタンスを初期化します。Initializes a new instance of the UTF32Encoding class. パラメーターでは、ビッグ エンディアン バイト順を使用するかどうか、Unicode バイト順マークを付加するかどうか、および無効なエンコーディングを検出したときに例外をスローするかどうかを指定します。Parameters specify whether to use the big endian byte order, whether to provide a Unicode byte order mark, and whether to throw an exception when an invalid encoding is detected.

プロパティ

BodyName

派生クラスでオーバーライドされた場合、メール エージェントの Body タグと共に使用できる現在のエンコーディングの名前を取得します。When overridden in a derived class, gets a name for the current encoding that can be used with mail agent body tags.

(継承元 Encoding)
CodePage

派生クラスでオーバーライドされた場合、現在の Encoding のコード ページ ID を取得します。When overridden in a derived class, gets the code page identifier of the current Encoding.

(継承元 Encoding)
DecoderFallback

現在の DecoderFallback オブジェクトの Encoding オブジェクトを取得または設定します。Gets or sets the DecoderFallback object for the current Encoding object.

(継承元 Encoding)
EncoderFallback

現在の EncoderFallback オブジェクトの Encoding オブジェクトを取得または設定します。Gets or sets the EncoderFallback object for the current Encoding object.

(継承元 Encoding)
EncodingName

派生クラスでオーバーライドされた場合、現在のエンコーディングについての記述を、ユーザーが判読できる形式で取得します。When overridden in a derived class, gets the human-readable description of the current encoding.

(継承元 Encoding)
HeaderName

派生クラスでオーバーライドされた場合、メール エージェント ヘッダー タグと共に使用できる現在のエンコーディングの名前を取得します。When overridden in a derived class, gets a name for the current encoding that can be used with mail agent header tags.

(継承元 Encoding)
IsBrowserDisplay

派生クラスでオーバーライドされた場合、ブラウザー クライアントが現在のエンコーディングを使用してコンテンツを表示できるかどうかを示す値を取得します。When overridden in a derived class, gets a value indicating whether the current encoding can be used by browser clients for displaying content.

(継承元 Encoding)
IsBrowserSave

派生クラスでオーバーライドされた場合、ブラウザー クライアントが現在のエンコーディングを使用してコンテンツを保存できるかどうかを示す値を取得します。When overridden in a derived class, gets a value indicating whether the current encoding can be used by browser clients for saving content.

(継承元 Encoding)
IsMailNewsDisplay

派生クラスでオーバーライドされた場合、メール クライアントおよびニュース クライアントが現在のエンコーディングを使用してコンテンツを表示できるかどうかを示す値を取得します。When overridden in a derived class, gets a value indicating whether the current encoding can be used by mail and news clients for displaying content.

(継承元 Encoding)
IsMailNewsSave

派生クラスでオーバーライドされた場合、メール クライアントおよびニュース クライアントが現在のエンコーディングを使用してコンテンツを保存できるかどうかを示す値を取得します。When overridden in a derived class, gets a value indicating whether the current encoding can be used by mail and news clients for saving content.

(継承元 Encoding)
IsReadOnly

派生クラスでオーバーライドされた場合、現在のエンコーディングが読み取り専用かどうかを示す値を取得します。When overridden in a derived class, gets a value indicating whether the current encoding is read-only.

(継承元 Encoding)
IsSingleByte

派生クラスでオーバーライドされた場合、現在のエンコーディングが 1 バイトのコード ポイントを使用するかどうかを示す値を取得します。When overridden in a derived class, gets a value indicating whether the current encoding uses single-byte code points.

(継承元 Encoding)
Preamble

このオブジェクトが UTF-32 形式でエンコードされた Unicode バイト順マークを提供するように構成されている場合は、そのようなマークを取得します。Gets a Unicode byte order mark encoded in UTF-32 format, if this object is configured to supply one.

Preamble

派生クラスでオーバーライドされた場合、使用するエンコードを指定するバイト シーケンスを含むスパンが返されます。When overridden in a derived class, returns a span containing the sequence of bytes that specifies the encoding used.

(継承元 Encoding)
WebName

派生クラスでオーバーライドされた場合、現在のエンコーディングの IANA (Internet Assigned Numbers Authority) に登録されている名前を取得します。When overridden in a derived class, gets the name registered with the Internet Assigned Numbers Authority (IANA) for the current encoding.

(継承元 Encoding)
WindowsCodePage

派生クラスでオーバーライドされた場合、現在のエンコーディングに最も厳密に対応する Windows オペレーティング システムのコード ページを取得します。When overridden in a derived class, gets the Windows operating system code page that most closely corresponds to the current encoding.

(継承元 Encoding)

メソッド

Clone()

派生クラスでオーバーライドされた場合、現在の Encoding オブジェクトの簡易コピーを作成します。When overridden in a derived class, creates a shallow copy of the current Encoding object.

(継承元 Encoding)
Equals(Object)

指定した Object が、現在の UTF32Encoding オブジェクトと等しいかどうかを判断します。Determines whether the specified Object is equal to the current UTF32Encoding object.

GetByteCount(Char*, Int32)

指定した文字ポインターで始まる文字のセットをエンコードすることによって生成されるバイト数を計算します。Calculates the number of bytes produced by encoding a set of characters starting at the specified character pointer.

GetByteCount(Char[])

派生クラスでオーバーライドされた場合、指定した文字配列に格納されているすべての文字をエンコードすることによって生成されるバイト数を計算します。When overridden in a derived class, calculates the number of bytes produced by encoding all the characters in the specified character array.

(継承元 Encoding)
GetByteCount(Char[], Int32, Int32)

指定した文字配列から文字のセットをエンコードすることによって生成されるバイト数を計算します。Calculates the number of bytes produced by encoding a set of characters from the specified character array.

GetByteCount(ReadOnlySpan<Char>)

派生クラスでオーバーライドされた場合、指定した文字スパンに格納されている文字をエンコードすることによって生成されるバイト数を計算します。When overridden in a derived class, calculates the number of bytes produced by encoding the characters in the specified character span.

(継承元 Encoding)
GetByteCount(String)

指定した String 内の文字をエンコードすることによって生成されるバイト数を計算します。Calculates the number of bytes produced by encoding the characters in the specified String.

GetByteCount(String, Int32, Int32)

派生クラスでオーバーライドされた場合、指定した文字列の文字のセットをエンコードすることによって生成されるバイト数を計算します。When overridden in a derived class, calculates the number of bytes produced by encoding a set of characters from the specified string.

(継承元 Encoding)
GetBytes(Char*, Int32, Byte*, Int32)

指定した文字ポインターで始まる文字のセットを、指定したバイト ポインターを開始位置として格納されるバイト シーケンスにエンコードします。Encodes a set of characters starting at the specified character pointer into a sequence of bytes that are stored starting at the specified byte pointer.

GetBytes(Char[])

派生クラスでオーバーライドされた場合、指定した文字配列に格納されているすべての文字をバイト シーケンスにエンコードします。When overridden in a derived class, encodes all the characters in the specified character array into a sequence of bytes.

(継承元 Encoding)
GetBytes(Char[], Int32, Int32)

派生クラスでオーバーライドされた場合、指定した文字配列に格納されている文字のセットをバイト シーケンスにエンコードします。When overridden in a derived class, encodes a set of characters from the specified character array into a sequence of bytes.

(継承元 Encoding)
GetBytes(Char[], Int32, Int32, Byte[], Int32)

指定した文字配列に格納されている文字のセットを指定したバイト配列にエンコードします。Encodes a set of characters from the specified character array into the specified byte array.

GetBytes(ReadOnlySpan<Char>, Span<Byte>)

派生クラスでオーバーライドされた場合、指定した読み取り専用スパンに格納されている文字のセットをバイトのスパンにエンコードします。When overridden in a derived class, encodes into a span of bytes a set of characters from the specified read-only span.

(継承元 Encoding)
GetBytes(String)

派生クラスでオーバーライドされた場合、指定した文字列に含まれるすべての文字をバイト シーケンスにエンコードします。When overridden in a derived class, encodes all the characters in the specified string into a sequence of bytes.

(継承元 Encoding)
GetBytes(String, Int32, Int32)

派生クラスでオーバーライドされた場合、指定した文字列内の count で指定した数の文字を、指定した index からバイト配列にエンコードします。When overridden in a derived class, encodes into an array of bytes the number of characters specified by count in the specified string, starting from the specified index.

(継承元 Encoding)
GetBytes(String, Int32, Int32, Byte[], Int32)

指定した String の文字セットを、指定したバイト配列にエンコードします。Encodes a set of characters from the specified String into the specified byte array.

GetCharCount(Byte*, Int32)

指定したバイト ポインターで始まるバイト シーケンスをデコードすることによって生成される文字数を計算します。Calculates the number of characters produced by decoding a sequence of bytes starting at the specified byte pointer.

GetCharCount(Byte[])

派生クラスでオーバーライドされた場合、指定したバイト配列に格納されているすべてのバイトをデコードすることによって生成される文字数を計算します。When overridden in a derived class, calculates the number of characters produced by decoding all the bytes in the specified byte array.

(継承元 Encoding)
GetCharCount(Byte[], Int32, Int32)

指定したバイト配列からバイト シーケンスをデコードすることによって生成される文字数を計算します。Calculates the number of characters produced by decoding a sequence of bytes from the specified byte array.

GetCharCount(ReadOnlySpan<Byte>)

派生クラスでオーバーライドされた場合、指定した読み取り専用バイト スパンをデコードすることによって生成される文字数を計算します。When overridden in a derived class, calculates the number of characters produced by decoding the provided read-only byte span.

(継承元 Encoding)
GetChars(Byte*, Int32, Char*, Int32)

指定したバイト ポインターで始まるバイト シーケンスを、指定した文字ポインターを開始位置として格納される文字のセットにデコードします。Decodes a sequence of bytes starting at the specified byte pointer into a set of characters that are stored starting at the specified character pointer.

GetChars(Byte[])

派生クラスでオーバーライドされた場合、指定したバイト配列に格納されているすべてのバイトを文字のセットにデコードします。When overridden in a derived class, decodes all the bytes in the specified byte array into a set of characters.

(継承元 Encoding)
GetChars(Byte[], Int32, Int32)

派生クラスでオーバーライドされた場合、指定したバイト配列に格納されているバイト シーケンスを文字のセットにデコードします。When overridden in a derived class, decodes a sequence of bytes from the specified byte array into a set of characters.

(継承元 Encoding)
GetChars(Byte[], Int32, Int32, Char[], Int32)

指定したバイト配列に格納されているバイト シーケンスを指定した文字配列にデコードします。Decodes a sequence of bytes from the specified byte array into the specified character array.

GetChars(ReadOnlySpan<Byte>, Span<Char>)

派生クラスでオーバーライドされた場合、指定した読み取り専用バイト スパンに格納されているすべてのバイトを、文字スパンにデコードします。When overridden in a derived class, decodes all the bytes in the specified read-only byte span into a character span.

(継承元 Encoding)
GetDecoder()

UTF-32 でエンコードされたバイト シーケンスを Unicode 文字のシーケンスに変換するデコーダーを取得します。Obtains a decoder that converts a UTF-32 encoded sequence of bytes into a sequence of Unicode characters.

GetEncoder()

Unicode 文字のシーケンスを UTF-32 でエンコードされたバイト シーケンスに変換するエンコーダーを取得します。Obtains an encoder that converts a sequence of Unicode characters into a UTF-32 encoded sequence of bytes.

GetHashCode()

現在のインスタンスのハッシュ コードを返します。Returns the hash code for the current instance.

GetMaxByteCount(Int32)

指定した文字数をエンコードすることによって生成される最大バイト数を計算します。Calculates the maximum number of bytes produced by encoding the specified number of characters.

GetMaxCharCount(Int32)

指定したバイト数をデコードすることによって生成される最大文字数を計算します。Calculates the maximum number of characters produced by decoding the specified number of bytes.

GetPreamble()

UTF32Encoding オブジェクトが UTF-32 形式でエンコードされた Unicode バイト順マークを提供するように構成されている場合、そのようなマークが返されます。Returns a Unicode byte order mark encoded in UTF-32 format, if the UTF32Encoding object is configured to supply one.

GetString(Byte*, Int32)

派生クラスでオーバーライドされた場合、指定したアドレスで始まる指定したバイト数を文字列にデコードします。When overridden in a derived class, decodes a specified number of bytes starting at a specified address into a string.

(継承元 Encoding)
GetString(Byte[])

派生クラスでオーバーライドされた場合、指定したバイト配列に格納されているすべてのバイトを文字列にデコードします。When overridden in a derived class, decodes all the bytes in the specified byte array into a string.

(継承元 Encoding)
GetString(Byte[], Int32, Int32)

バイト配列に格納されているある範囲のバイトを文字列にデコードします。Decodes a range of bytes from a byte array into a string.

GetString(ReadOnlySpan<Byte>)

派生クラスでオーバーライドされた場合、指定したバイト スパンに格納されているすべてのバイトを文字列にデコードします。When overridden in a derived class, decodes all the bytes in the specified byte span into a string.

(継承元 Encoding)
GetType()

現在のインスタンスの Type を取得します。Gets the Type of the current instance.

(継承元 Object)
IsAlwaysNormalized()

現在のエンコーディングが、既定の正規形を使用して常に正規化されるかどうかを示す値。Gets a value indicating whether the current encoding is always normalized, using the default normalization form.

(継承元 Encoding)
IsAlwaysNormalized(NormalizationForm)

派生クラスでオーバーライドされた場合、現在のエンコーディングが、指定した正規形を使用して常に正規化されるかどうかを示す値を取得します。When overridden in a derived class, gets a value indicating whether the current encoding is always normalized, using the specified normalization form.

(継承元 Encoding)
MemberwiseClone()

現在の Object の簡易コピーを作成します。Creates a shallow copy of the current Object.

(継承元 Object)
ToString()

現在のオブジェクトを表す文字列を返します。Returns a string that represents the current object.

(継承元 Object)

拡張メソッド

GetBytes(Encoding, ReadOnlySequence<Char>)

指定された Encoding を使用して、指定された ReadOnlySequence<T>Byte 配列にエンコードします。Encodes the specified ReadOnlySequence<T> into a Byte array using the specified Encoding.

GetBytes(Encoding, ReadOnlySequence<Char>, IBufferWriter<Byte>)

指定された Encoding を使用して指定された ReadOnlySequence<T>byte にデコードし、結果を writer に書き込みます。Decodes the specified ReadOnlySequence<T> to bytes using the specified Encoding and writes the result to writer.

GetBytes(Encoding, ReadOnlySequence<Char>, Span<Byte>)

指定された Encoding を使用して指定された ReadOnlySequence<T>byte にエンコードし、結果を bytes に出力します。Encodes the specified ReadOnlySequence<T> to bytes using the specified Encoding and outputs the result to bytes.

GetBytes(Encoding, ReadOnlySpan<Char>, IBufferWriter<Byte>)

指定された Encoding を使用して指定された ReadOnlySpan<T>byte にエンコードし、結果を writer に書き込みます。Encodes the specified ReadOnlySpan<T> to bytes using the specified Encoding and writes the result to writer.

GetChars(Encoding, ReadOnlySequence<Byte>, IBufferWriter<Char>)

指定された Encoding を使用して指定された ReadOnlySequence<T>char にデコードし、結果を writer に書き込みます。Decodes the specified ReadOnlySequence<T> to chars using the specified Encoding and writes the result to writer.

GetChars(Encoding, ReadOnlySequence<Byte>, Span<Char>)

指定された Encoding を使用して指定された ReadOnlySequence<T>char にデコードし、結果を chars に出力します。Decodes the specified ReadOnlySequence<T> to chars using the specified Encoding and outputs the result to chars.

GetChars(Encoding, ReadOnlySpan<Byte>, IBufferWriter<Char>)

指定された Encoding を使用して指定された ReadOnlySpan<T>char にデコードし、結果を writer に書き込みます。Decodes the specified ReadOnlySpan<T> to chars using the specified Encoding and writes the result to writer.

GetString(Encoding, ReadOnlySequence<Byte>)

指定された Encoding を使用して、指定された ReadOnlySequence<T>String にデコードします。Decodes the specified ReadOnlySequence<T> into a String using the specified Encoding.

適用対象

こちらもご覧ください