Sqoop

Sqoop er en kommandolinje-grensesnitt-programvare for å overføre data mellom relasjonsdatabaser og Hadoop.[5] Det støtter inkrementell lasting av en enkelt tabell eller friforms SQL-spørring såvel som lagrede jobber som kan kjøres mange ganger for å importere oppdateringer gjort i databasen siden sist import. Importer kan også brukes til å populere tabeller i Hive eller HBase.[6] Eksporter kan brukes for å legge inn data fra Hadoop inn i relasjonsdatabaser.Sqoop ble et topp-nivå Apache-prosjekt i mars 2012.[7]

Sqoop
Utvikler(e)Apache Software Foundation
Utgitt 21. september 2014[1]
Nyeste versjon1.4.6 (11. mai 2015)
Kodelagerhttps://git-wip-us.apache.org/repos/asf/sqoop.git
PlattformJava Virtual Machine
Skrevet iJava[2][1]
TypeDataadministrasjon, stordata[1]
LisensApache License 2.0[3]
Nettstedsqoop.apache.org (en)
sqoop.apache.org[4]
Last nedhttp://sqoop.apache.org/

Microsoft bruker en Sqoop-basert forbindelse for å hjelpe til med å overføre data fra Microsoft SQL Server-databaser til Hadoop.[8]Couchbase, Inc. tilbyr også en Couchbase Server-Hadoop forbindelse ved hjelp av Sqoop.[9]

I 2015 beskrev Ralph Kimball Sqoop som følger under overskriften Fremtiden for ETL:[10]

Several big changes must take place in the ETL environment. First, the data feeds from original sources must support huge bandwidths, at least gigabytes per second. Learn about Sqoop loading data into Hadoop. If these words mean nothing to you, you have some reading to do! Start with Wikipedia.

Se også

Referanser

Bibliografi

Eksterne lenker