在 .NET 中剖析數值字串

所有數值類型皆有兩個靜態剖析方法:ParseTryParse,可將數字的字串表示轉換成數值類型。 這些方法可讓您剖析使用標準數值格式字串自訂數值格式字串中記錄的格式字串所產生的字串。 根據預設,ParseTryParse 方法只能將包含十進位數字的字串成功轉換為整數值。 它們可以將包含整數和小數的十進位數字、群組分隔符號,以及小數分隔符號的字串,成功轉換為浮點值。 如果作業失敗,即 TryParse 方法傳回 false,則 Parse 方法會擲回例外狀況。

剖析及格式提供者

數值的字串表示通常會隨文化特性而不同。 數值字串的元素,例如貨幣符號、群組 (或千) 分隔符號和小數分隔符號,全都會因文化特性而異。 剖析方法會隱含或明確使用能夠辨識這些特定文化特性變化的格式提供者。 如果未在或方法的呼叫中指定格式提供 ParseTryParse ,則會使用與目前文化特性相關聯的格式提供者 (NumberFormatInfo 屬性) 所傳回的物件 NumberFormatInfo.CurrentInfo

格式提供者會由 IFormatProvider 實作來代表。 此介面具有單一成員 (GetFormat 方法),它的單一參數是表示要格式化之類型的 Type 物件。 此方法會傳回提供格式設定資訊的物件。 .NET 支援下列兩個可用來剖析數值字串的 IFormatProvider 實作:

下列範例會嘗試將陣列中的每個字串轉換為 Double 值。 它會先嘗試使用反映英文 (美國) 文化特性慣例的格式提供者剖析字串。 如果此作業擲回 FormatException,它就會嘗試使用可反映法文 (法國) 文化特性慣例的格式提供者來剖析字串。

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      string[] values = { "1,304.16", "$1,456.78", "1,094", "152",
                          "123,45 €", "1 304,16", "Ae9f" };
      double number;
      CultureInfo culture = null;

      foreach (string value in values) {
         try {
            culture = CultureInfo.CreateSpecificCulture("en-US");
            number = Double.Parse(value, culture);
            Console.WriteLine("{0}: {1} --> {2}", culture.Name, value, number);
         }
         catch (FormatException) {
            Console.WriteLine("{0}: Unable to parse '{1}'.",
                              culture.Name, value);
            culture = CultureInfo.CreateSpecificCulture("fr-FR");
            try {
               number = Double.Parse(value, culture);
               Console.WriteLine("{0}: {1} --> {2}", culture.Name, value, number);
            }
            catch (FormatException) {
               Console.WriteLine("{0}: Unable to parse '{1}'.",
                                 culture.Name, value);
            }
         }
         Console.WriteLine();
      }
   }
}
// The example displays the following output:
//    en-US: 1,304.16 --> 1304.16
//
//    en-US: Unable to parse '$1,456.78'.
//    fr-FR: Unable to parse '$1,456.78'.
//
//    en-US: 1,094 --> 1094
//
//    en-US: 152 --> 152
//
//    en-US: Unable to parse '123,45 €'.
//    fr-FR: Unable to parse '123,45 €'.
//
//    en-US: Unable to parse '1 304,16'.
//    fr-FR: 1 304,16 --> 1304.16
//
//    en-US: Unable to parse 'Ae9f'.
//    fr-FR: Unable to parse 'Ae9f'.
Imports System.Globalization

Module Example
    Public Sub Main()
        Dim values() As String = {"1,304.16", "$1,456.78", "1,094", "152",
                                   "123,45 €", "1 304,16", "Ae9f"}
        Dim number As Double
        Dim culture As CultureInfo = Nothing

        For Each value As String In values
            Try
                culture = CultureInfo.CreateSpecificCulture("en-US")
                number = Double.Parse(value, culture)
                Console.WriteLine("{0}: {1} --> {2}", culture.Name, value, number)
            Catch e As FormatException
                Console.WriteLine("{0}: Unable to parse '{1}'.",
                                  culture.Name, value)
                culture = CultureInfo.CreateSpecificCulture("fr-FR")
                Try
                    number = Double.Parse(value, culture)
                    Console.WriteLine("{0}: {1} --> {2}", culture.Name, value, number)
                Catch ex As FormatException
                    Console.WriteLine("{0}: Unable to parse '{1}'.",
                                      culture.Name, value)
                End Try
            End Try
            Console.WriteLine()
        Next
    End Sub
End Module
' The example displays the following output:
'    en-US: 1,304.16 --> 1304.16
'    
'    en-US: Unable to parse '$1,456.78'.
'    fr-FR: Unable to parse '$1,456.78'.
'    
'    en-US: 1,094 --> 1094
'    
'    en-US: 152 --> 152
'    
'    en-US: Unable to parse '123,45 €'.
'    fr-FR: Unable to parse '123,45 €'.
'    
'    en-US: Unable to parse '1 304,16'.
'    fr-FR: 1 304,16 --> 1304.16
'    
'    en-US: Unable to parse 'Ae9f'.
'    fr-FR: Unable to parse 'Ae9f'.

剖析和 NumberStyles 值

剖析作業可處理的樣式元素 (例如空白字元、群組分隔符號和小數分隔符號),會由 NumberStyles 列舉值來定義。 根據預設,代表整數值的字串會使用 NumberStyles.Integer 值進行剖析,這僅允許數字、前置和後置空白字元,以及前置正負號。 表示浮點值的字串會使用 NumberStyles.FloatNumberStyles.AllowThousands 值的組合進行剖析,此複合樣式允許十進位數字,以及前置和後置空白字元、前置正負號、小數分隔符號、群組分隔符號和指數。 您可以藉由呼叫包含 NumberStyles 類型參數之 ParseTryParse 方法的多載,並設定一或多個 NumberStyles 旗標,來控制可在字串中顯示的樣式元素,使剖析作業得以成功進行。

例如,包含群組分隔符號的字串無法使用 Int32 方法轉換為 Int32.Parse(String) 值。 然而,如果您使用 NumberStyles.AllowThousands 旗標,則轉換會成功,如下列範例所示。

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      string value = "1,304";
      int number;
      IFormatProvider provider = CultureInfo.CreateSpecificCulture("en-US");
      if (Int32.TryParse(value, out number))
         Console.WriteLine("{0} --> {1}", value, number);
      else
         Console.WriteLine("Unable to convert '{0}'", value);

      if (Int32.TryParse(value, NumberStyles.Integer | NumberStyles.AllowThousands,
                        provider, out number))
         Console.WriteLine("{0} --> {1}", value, number);
      else
         Console.WriteLine("Unable to convert '{0}'", value);
   }
}
// The example displays the following output:
//       Unable to convert '1,304'
//       1,304 --> 1304
Imports System.Globalization

Module Example
    Public Sub Main()
        Dim value As String = "1,304"
        Dim number As Integer
        Dim provider As IFormatProvider = CultureInfo.CreateSpecificCulture("en-US")
        If Int32.TryParse(value, number) Then
            Console.WriteLine("{0} --> {1}", value, number)
        Else
            Console.WriteLine("Unable to convert '{0}'", value)
        End If

        If Int32.TryParse(value, NumberStyles.Integer Or NumberStyles.AllowThousands,
                          provider, number) Then
            Console.WriteLine("{0} --> {1}", value, number)
        Else
            Console.WriteLine("Unable to convert '{0}'", value)
        End If
    End Sub
End Module
' The example displays the following output:
'       Unable to convert '1,304'
'       1,304 --> 1304

警告

剖析作業一律使用特定文化特性的格式化慣例。 如果未藉由傳遞 CultureInfoNumberFormatInfo 物件來指定文化特性,就會使用與目前執行緒相關聯的文化特性。

下表列出 NumberStyles 列舉的成員,並說明它們對剖析作業的影響。

NumberStyles 值 對要剖析字串的影響
NumberStyles.None 只允許數字。
NumberStyles.AllowDecimalPoint 允許小數分隔符號和小數位。 若為整數值,小數位只允許零。 有效的小數分隔符號會由 NumberFormatInfo.NumberDecimalSeparatorNumberFormatInfo.CurrencyDecimalSeparator 屬性來決定。
NumberStyles.AllowExponent 可以使用 "e" 或 "E" 字元表示指數標記法。 如需詳細資訊,請參閱 NumberStyles
NumberStyles.AllowLeadingWhite 可以使用前置空白字元。
NumberStyles.AllowTrailingWhite 可以使用後置空白字元。
NumberStyles.AllowLeadingSign 數字前面可以使用正負號。
NumberStyles.AllowTrailingSign 數字後面可以使用正負號。
NumberStyles.AllowParentheses 可以使用括號表示負數值。
NumberStyles.AllowThousands 允許群組分隔符號。 群組分隔符號字元會由 NumberFormatInfo.NumberGroupSeparatorNumberFormatInfo.CurrencyGroupSeparator 屬性來決定。
NumberStyles.AllowCurrencySymbol 允許使用貨幣符號。 貨幣符號會由 NumberFormatInfo.CurrencySymbol 屬性來定義。
NumberStyles.AllowHexSpecifier 要剖析的字串會解譯為十六進位數字。 它可以包含十六進位數字 0-9、A-F 和 a-f。 這個旗標只能用於剖析整數值。

此外,NumberStyles 列舉提供下列複合樣式,其中包括多個 NumberStyles 旗標。

複合的 NumberStyles 值 包含成員
NumberStyles.Integer 包含 NumberStyles.AllowLeadingWhiteNumberStyles.AllowTrailingWhiteNumberStyles.AllowLeadingSign 樣式。 這是用來剖析整數值的預設樣式。
NumberStyles.Number 包含 NumberStyles.AllowLeadingWhiteNumberStyles.AllowTrailingWhiteNumberStyles.AllowLeadingSignNumberStyles.AllowTrailingSignNumberStyles.AllowDecimalPointNumberStyles.AllowThousands 樣式。
NumberStyles.Float 包含 NumberStyles.AllowLeadingWhiteNumberStyles.AllowTrailingWhiteNumberStyles.AllowLeadingSignNumberStyles.AllowDecimalPointNumberStyles.AllowExponent 樣式。
NumberStyles.Currency 包含 NumberStyles.AllowExponentNumberStyles.AllowHexSpecifier 以外的所有樣式。
NumberStyles.Any 包含 NumberStyles.AllowHexSpecifier 以外的所有樣式。
NumberStyles.HexNumber 包含 NumberStyles.AllowLeadingWhiteNumberStyles.AllowTrailingWhiteNumberStyles.AllowHexSpecifier 樣式。

剖析和 Unicode 數字

Unicode 標準會定義各種書寫系統中數字的字碼指標。 例如,U+0030 到 U+0039 的字碼指標表示基本拉丁文數字 0 到 9,U+09E6 到 U+09EF 字碼指標表示孟加拉文數字 0 到 9,而 U+FF10 到 U+FF19 字碼指數表示全形數字 0 到 9。 不過,剖析方法唯一認識的數字是基本拉丁文數字 0-9 與 U+0030 到 U+0039 字碼指標。 如果將包含任何其他數字的字串傳遞給數值剖析方法,則該方法會擲回 FormatException

下列範例會使用 Int32.Parse 方法,來剖析以不同書寫系統的數字組成的字串。 如範例的輸出所示,嘗試剖析基本拉丁文數字會成功,而嘗試剖析全型、阿拉伯-印度文和孟加拉文數字則會失敗。

using System;

public class Example
{
   public static void Main()
   {
      string value;
      // Define a string of basic Latin digits 1-5.
      value = "\u0031\u0032\u0033\u0034\u0035";
      ParseDigits(value);

      // Define a string of Fullwidth digits 1-5.
      value = "\uFF11\uFF12\uFF13\uFF14\uFF15";
      ParseDigits(value);

      // Define a string of Arabic-Indic digits 1-5.
      value = "\u0661\u0662\u0663\u0664\u0665";
      ParseDigits(value);

      // Define a string of Bangla digits 1-5.
      value = "\u09e7\u09e8\u09e9\u09ea\u09eb";
      ParseDigits(value);
   }

   static void ParseDigits(string value)
   {
      try {
         int number = Int32.Parse(value);
         Console.WriteLine("'{0}' --> {1}", value, number);
      }
      catch (FormatException) {
         Console.WriteLine("Unable to parse '{0}'.", value);
      }
   }
}
// The example displays the following output:
//       '12345' --> 12345
//       Unable to parse '12345'.
//       Unable to parse '١٢٣٤٥'.
//       Unable to parse '১২৩৪৫'.
Module Example
    Public Sub Main()
        Dim value As String
        ' Define a string of basic Latin digits 1-5.
        value = ChrW(&h31) + ChrW(&h32) + ChrW(&h33) + ChrW(&h34) + ChrW(&h35)
        ParseDigits(value)

        ' Define a string of Fullwidth digits 1-5.
        value = ChrW(&hff11) + ChrW(&hff12) + ChrW(&hff13) + ChrW(&hff14) + ChrW(&hff15)
        ParseDigits(value)

        ' Define a string of Arabic-Indic digits 1-5.
        value = ChrW(&h661) + ChrW(&h662) + ChrW(&h663) + ChrW(&h664) + ChrW(&h665)
        ParseDigits(value)

        ' Define a string of Bangla digits 1-5.
        value = ChrW(&h09e7) + ChrW(&h09e8) + ChrW(&h09e9) + ChrW(&h09ea) + ChrW(&h09eb)
        ParseDigits(value)
    End Sub

    Sub ParseDigits(value As String)
        Try
            Dim number As Integer = Int32.Parse(value)
            Console.WriteLine("'{0}' --> {1}", value, number)
        Catch e As FormatException
            Console.WriteLine("Unable to parse '{0}'.", value)
        End Try
    End Sub
End Module
' The example displays the following output:
'       '12345' --> 12345
'       Unable to parse '12345'.
'       Unable to parse '١٢٣٤٥'.
'       Unable to parse '১২৩৪৫'.

另請參閱