Table hive

Cet article explique comment importer une table Hive du stockage cloud dans Azure Databricks à l’aide d’une table externe.

Étape 1 : Afficher l’instruction CREATE TABLE

Émettez une commande SHOW CREATE TABLE <tablename> sur la ligne de commande Hive pour voir l’instruction qui a créé la table.

hive> SHOW CREATE TABLE wikicc;
OK
CREATE  TABLE `wikicc`(
  `country` string,
  `count` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
  'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  '<path-to-table>'
TBLPROPERTIES (
  'totalSize'='2335',
  'numRows'='240',
  'rawDataSize'='2095',
  'COLUMN_STATS_ACCURATE'='true',
  'numFiles'='1',
  'transient_lastDdlTime'='1418173653')

Étape 2 : Émettre une instruction CREATE EXTERNAL TABLE

Si l’instruction renvoyée utilise une commande CREATE TABLE, copiez l’instruction et remplacez CREATE TABLE par CREATE EXTERNAL TABLE.

  • EXTERNAL garantit que Spark SQL ne supprime pas vos données si vous supprimez la table.
  • Vous pouvez omettre le champ TBLPROPERTIES.
DROP TABLE wikicc
CREATE EXTERNAL TABLE `wikicc`(
  `country` string,
  `count` int)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
  'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  '<path-to-table>'

Étape 3 : Émettre des commandes SQL sur vos données

SELECT * FROM wikicc