三藩市保管庫資料

舊金山的消防部門服務通話和 311 案件。

注意

Microsoft 會以「如目前」為基礎提供 Azure 開放資料集。 Microsoft 不會就您使用資料集做出任何明示或默示擔保或條件。 根據當地法律所允許的範圍,Microsoft 會免除因使用資料集而產生的任何損害或損失的所有責任,包括直接、衍生、特殊、間接、附帶或懲罰性。

此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。

消防通話服務包括回應通話的所有消防單位。 每筆記錄都包含通話號碼、事件號碼、地址、單位識別碼、通話類型和處置方式, 亦包括所有相關的時間間隔。 由於這份資料集是以回應為基礎,且大多數通話都涉及多個單位,因此每個通話號碼均有多筆記錄。 位址與區塊號碼、交集或呼叫方塊相關聯,而不是特定位址。

311 案例包括與地點或事物相關的案件(例如公園、街道或建築物),並在 2008 年 7 月 1 日之後建立。 系統會排除使用者記錄自己需求的情況。 例如,物業或營業稅問題、停車許可要求等等。 如需詳細資訊,請參閱 Program Link

磁片區和保留期

此資料集以 Parquet 格式儲存, 截至 2019 年,每天會更新大約 600 MB 的資料列(400 MB)。

此資料集包含從 2015 年累積至今的歷史記錄。 在我們的 SDK 中,您可以使用參數設定來擷取特定時間範圍內的資料。

儲存位置

此資料集儲存於美國東部 Azure 區域。 建議您在美國東部配置計算資源,以確保同質性。

資料行

名稱 資料類型 唯一 Values (sample) 描述
address string 280,652 未與特定位址 0 區塊 6TH ST 相關聯 事件位址(注意:位址和位置一般化為街道中間街區、十字路口或最近的通話方位置,以保護來電者隱私權)。
category string 108 街道和人行道清潔可能危及生命 人類可讀的 311 案件服務要求類型名稱,或 911 消防通話的通話類型群組名稱。
dataSubtype 字串 2 911_Fire 311_All 「911_Fire」 或 「311_All」。
dataType string 1 安全性 「保管庫ty」
dateTime timestamp 6,496,563 2020-10-19 12:28:08 2020-07-28 06:40:26 服務要求建立的日期和時間,或收到消防通話的時間。
緯度 double 1,615,369 37.777624238929 37.786117211838 使用 WGS84 投影的位置緯度。
經度 double 1,554,612 -122.39998111124 -122.419854245692 使用 WGS84 投影的位置經度。
來源 string 9 電話 Mobile/Open311 接收服務要求的機制或路徑;通常為 「電話」、「Text/SMS」、「Website」、「Mobile App」、「Twitter」 等,但字詞可能會因系統而異。
status 字串 3 已關閉開啟 服務要求目前狀態的單一字詞指標。 (注意:GeoReport V2 只允許「開啟」和「已關閉」)
子類別 string 1,270 醫療事件大量專案 人類可讀的 311 案件服務要求子類型名稱,或 911 消防通話的通話類型名稱。

預覽

dataType dataSubtype dateTime category 子類別 status address 緯度 經度 來源 extendedProperties
安全性 911_Fire 2021/4/26 上午 2:56:13 無生命危險 醫療事件 null 700 區塊 GEARY ST 37.7863607914647 -122.415616900246 null
安全性 911_Fire 2021/4/26 上午 2:56:13 無生命危險 醫療事件 null 700 區塊 GEARY ST 37.7863607914647 -122.415616900246 null
安全性 911_Fire 2021/4/26 上午 2:54:03 無生命危險 醫療事件 null 0 ESSEX ST 區塊 37.7860048266229 -122.395077258809 null
安全性 911_Fire 2021/4/26 上午 2:54:03 無生命危險 醫療事件 null 0 ESSEX ST 區塊 37.7860048266229 -122.395077258809 null
安全性 911_Fire 2021/4/26 上午 2:52:17 無生命危險 醫療事件 null 700 塊 29TH AVE 37.7751770865322 -122.488604397217 null
安全性 911_Fire 2021/4/26 上午 2:50:28 可能危及生命 醫療事件 null 1000 塊 GEARY ST 37.7857350982044 -122.420555240691 null
安全性 911_Fire 2021/4/26 上午 2:50:28 可能危及生命 醫療事件 null 1000 塊 GEARY ST 37.7857350982044 -122.420555240691 null
安全性 911_Fire 2021/4/26 上午 2:33:52 無生命危險 醫療事件 null 100 區塊 BELVEDERE ST 37.767791696654 -122.449332294394 null
安全性 911_Fire 2021/4/26 上午 2:33:52 無生命危險 醫療事件 null 100 區塊 BELVEDERE ST 37.767791696654 -122.449332294394 null
安全性 911_Fire 2021/4/26 上午 2:33:51 可能危及生命 醫療事件 null 100 區塊 6TH ST 37.7807920802756 -122.408385745499 null

資料存取

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import NycSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_pandas_dataframe()
safety.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycSafety

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
display(safety.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import NycSafety

from datetime import datetime
from dateutil import parser

end_date = parser.parse('2016-01-01')
start_date = parser.parse('2015-05-01')
safety = NycSafety(start_date=start_date, end_date=end_date)
safety = safety.to_spark_dataframe()
# Display top 5 rows
display(safety.limit(5))

範例

下一步

檢視開放式資料集目錄中 的其餘資料集